Commit 4e909a8a authored by 张彦钊's avatar 张彦钊

Merge branch 'master' of git.wanmeizhensuo.com:ML/ffm-baseline

change sql for test
parents a36e9ed5 467ab2d9
......@@ -114,7 +114,7 @@ def result2dict(result):
for i in result:
sum_count += i[1]
for i in result:
dct[i[0]] = "{}%".format(round(i[1]/sum_count*100,2))
dct[i[0]] = "{}--{}%".format(i[1],round(i[1]/sum_count*100,2))
print("sum:{}".format(sum_count))
return dct
......
......@@ -138,7 +138,7 @@ def result2dict(result):
for i in result:
sum_count += i[1]
for i in result:
dct[i[0]] = "{}%".format(round(i[1]/sum_count*100,2))
dct[i[0]] = "{}--{}%".format(i[1],round(i[1]/sum_count*100,2))
print("sum:{}".format(sum_count))
return dct
......
......@@ -23,11 +23,11 @@ def result2file(fpath):
1.1 answer曝光占比(=answer被曝光数/总cid被曝光数)
1.2 diary曝光占比(=diary被曝光数/总cid被曝光数)
1.3 活跃用户点击率(=有点击用户点击次数/有点击用户曝光次数)
1.4 活跃用户平均每天曝光次数(活跃用户指的是有点击的用户)
1.4 活跃用户平均每天曝光次数(=活跃用户曝光数/独立活跃用户数)
1.5 点击answer用户占比(=点击answer用户数/曝光answer用户数)
1.6 点击diary用户占比(=点击diary用户数/曝光diary用户数)
1.7 无点击用户占比(=无点击用户数/有曝光用户数)
1.8 无点击用户数分布占比(根据激活日期和平台来分)
1.8 无点击用户数分布(根据激活日期和平台来分) #注意:(]里面的数字指的是距离当前时间的天数
2.Top特征
2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量)
2.2 Top 100 diary (sorted by ctr)
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment