Name
Last commit
Last update
..
cidRate.py Loading commit data...
clkCidUidRate.py Loading commit data...
config.py Loading commit data...
df_to_tidb.py Loading commit data...
func.py Loading commit data...
getClickZeroUidDetail.py Loading commit data...
getRegisterUidDetail.py Loading commit data...
main.py Loading commit data...
readme.txt Loading commit data...
start.sh Loading commit data...
topFeatures.py Loading commit data...
utils.py Loading commit data...
#1.功能:
	从data_feed_click和data_feed_exposure两个表中统计一些推荐指标

#2.用法:
	sudo screen -S stat
	nvwa
	python /srv/apps/ffm-baseline/eda/recommended_indexs/main.py

#3.输出:
	result_{date}.txt  #发邮件使用
	rate.csv  #作图使用

#4.输出结果组成:
	内容概览:以下所有数据都是昨天一天的首页的
	1. 比例特征
		1.1 answer曝光占比(=answer被曝光数/总cid被曝光数)
		1.2 diary曝光占比(=diary被曝光数/总cid被曝光数)
		1.3 活跃用户点击率(=有点击用户点击次数/有点击用户曝光次数)
		1.4 活跃用户平均每天曝光次数(活跃用户指的是有点击的用户)
		1.5 点击answer用户占比(=点击answer用户数/曝光answer用户数)
		1.6 点击diary用户占比(=点击diary用户数/曝光diary用户数)
		1.7 无点击用户占比(=无点击用户数/有曝光用户数)
		1.8 无点击用户数分布占比(根据激活日期和平台来分)
	2.Top特征
		2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量)
		2.2 Top 100 diary (sorted by ctr)
		2.3 Top 100 Answer (sorted by ctr)
		2.4 Top 100 Question (sorted by ctr)

#5.requirements:
	python==3.4.3
	pymysql==0.9.2