Name
Last commit
Last update
..
cidRate.py Loading commit data...
clkCidUidRate.py Loading commit data...
config.py Loading commit data...
csv_sql.py Loading commit data...
df_to_tidb.py Loading commit data...
dingding_robot.py Loading commit data...
func.py Loading commit data...
getClickZeroUidDetail.py Loading commit data...
getRegisterUidDetail.py Loading commit data...
hypothesis_test.py Loading commit data...
knowledge_network.xls Loading commit data...
main.py Loading commit data...
nose.xls Loading commit data...
readme.txt Loading commit data...
send_email.py Loading commit data...
start.sh Loading commit data...
topFeatures.py Loading commit data...
utils.py Loading commit data...
wiki_item.xls Loading commit data...
xiaba.xls Loading commit data...
xiaba.xlsx Loading commit data...
#1.功能:
	从data_feed_click和data_feed_exposure两个表中统计一些推荐指标

#2.用法:
	sudo screen -S stat
	nvwa
	python /srv/apps/ffm-baseline/eda/recommended_indexs/main.py

#3.输出:
	result_{date}.txt  #发邮件使用
	rate.csv  #作图使用

#4.输出结果组成:
	内容概览:以下所有数据都是昨天一天的首页的
	1. 比例特征
		1.1 answer曝光占比(=answer被曝光数/总cid被曝光数)
		1.2 diary曝光占比(=diary被曝光数/总cid被曝光数)
		1.3 活跃用户点击率(=有点击用户点击次数/有点击用户曝光次数)
		1.4 活跃用户平均每天曝光次数(活跃用户指的是有点击的用户)
		1.5 点击answer用户占比(=点击answer用户数/曝光answer用户数)
		1.6 点击diary用户占比(=点击diary用户数/曝光diary用户数)
		1.7 无点击用户占比(=无点击用户数/有曝光用户数)
		1.8 无点击用户数分布占比(根据激活日期和平台来分)
	2.Top特征
		2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量)
		2.2 Top 100 diary (sorted by ctr)
		2.3 Top 100 Answer (sorted by ctr)
		2.4 Top 100 Question (sorted by ctr)

#5.requirements:
	python==3.4.3
	pymysql==0.9.2