#1.功能: 从data_feed_click和data_feed_exposure两个表中统计一些推荐指标 #2.用法: sudo screen -S stat nvwa python /srv/apps/ffm-baseline/eda/recommended_indexs/main.py #3.输出: result_{date}.txt #发邮件使用 rate.csv #作图使用 #4.输出结果组成: 内容概览:以下所有数据都是昨天一天的首页的 1. 比例特征 1.1 answer曝光占比(=answer被曝光数/总cid被曝光数) 1.2 diary曝光占比(=diary被曝光数/总cid被曝光数) 1.3 活跃用户点击率(=有点击用户点击次数/有点击用户曝光次数) 1.4 活跃用户平均每天曝光次数(活跃用户指的是有点击的用户) 1.5 点击answer用户占比(=点击answer用户数/曝光answer用户数) 1.6 点击diary用户占比(=点击diary用户数/曝光diary用户数) 1.7 无点击用户占比(=无点击用户数/有曝光用户数) 1.8 无点击用户数分布占比(根据激活日期和平台来分) 2.Top特征 2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量) 2.2 Top 100 diary (sorted by ctr) 2.3 Top 100 Answer (sorted by ctr) 2.4 Top 100 Question (sorted by ctr) #5.requirements: python==3.4.3 pymysql==0.9.2
-
王志伟 authored719501ff
Name |
Last commit
|
Last update |
---|---|---|
.. | ||
cidRate.py | Loading commit data... | |
clkCidUidRate.py | ||
config.py | ||
csv_sql.py | ||
df_to_tidb.py | ||
dingding_robot.py | ||
func.py | ||
getClickZeroUidDetail.py | ||
getRegisterUidDetail.py | ||
hypothesis_test.py | ||
knowledge_network.xls | ||
main.py | ||
nose.xls | ||
readme.txt | ||
send_email.py | ||
start.sh | ||
topFeatures.py | ||
utils.py | ||
wiki_item.xls | ||
xiaba.xls | ||
xiaba.xlsx |