#1.功能: 从data_feed_click和data_feed_exposure两个表中统计一些推荐指标 #2.用法: sudo screen -S stat nvwa python /srv/apps/ffm-baseline/eda/recommended_indexs/main.py #3.输出: result_{date}.txt #发邮件使用 rate.csv #作图使用 #4.输出结果组成: 内容概览:以下所有数据都是昨天一天的首页的 1. 比例特征 1.1 answer曝光占比(=answer被曝光数/总cid被曝光数) 1.2 diary曝光占比(=diary被曝光数/总cid被曝光数) 1.3 活跃用户点击率(=有点击用户点击次数/有点击用户曝光次数) 1.4 活跃用户平均每天曝光次数(活跃用户指的是有点击的用户) 1.5 点击answer用户占比(=点击answer用户数/曝光answer用户数) 1.6 点击diary用户占比(=点击diary用户数/曝光diary用户数) 1.7 无点击用户占比(=无点击用户数/有曝光用户数) 1.8 无点击用户数分布占比(根据激活日期和平台来分) 2.Top特征 2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量) 2.2 Top 100 diary (sorted by ctr) 2.3 Top 100 Answer (sorted by ctr) 2.4 Top 100 Question (sorted by ctr) #5.requirements: python==3.4.3 pymysql==0.9.2
-
王志伟 authored719501ff