Commit aa7cea9f authored by 张彦钊's avatar 张彦钊

Merge branch 'master' of git.wanmeizhensuo.com:ML/ffm-baseline

modify fetch_user_profile
parents 00713715 cf941a65
...@@ -18,21 +18,21 @@ def result2file(fpath): ...@@ -18,21 +18,21 @@ def result2file(fpath):
tplt = "{0:\u3000<6}\t{1:\u3000<15}\t{2:\u3000<15}\t{3:\u3000<15}\n" tplt = "{0:\u3000<6}\t{1:\u3000<15}\t{2:\u3000<15}\t{3:\u3000<15}\n"
line = """内容概览:以下所有数据都是首页的 line = """内容概览:以下所有数据都是首页的
1. 比例特征 1. 比例特征
1.1 answer曝光占比(=answer被曝光数/总cid被曝光数) 1.1 answer曝光占比(=answer被曝光数/总cid被曝光数)
1.2 活跃用户点击率(=活跃用户点击次数/活跃用户曝光次数) 1.2 活跃用户点击率(=活跃用户点击次数/活跃用户曝光次数)
1.3 点击answer用户占比(=点击answer用户数/曝光answer用户数) 1.3 点击answer用户占比(=点击answer用户数/曝光answer用户数)
1.4 点击diary用户占比(=点击diary用户数/曝光diary用户数) 1.4 点击diary用户占比(=点击diary用户数/曝光diary用户数)
1.5 无点击用户占比(=无点击用户数/有曝光用户数) 1.5 无点击用户占比(=无点击用户数/有曝光用户数)
2.Top特征 2.Top特征
2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量) 2.1 用户点击次数分布(第一列:用户点击次数;第二列:独立用户数量)
2.2 Top 100 diary(sorted by ctr) 2.2 Top 100 diary(sorted by ctr)
2.3 Top 100 Answer(sorted by ctr) 2.3 Top 100 Answer(sorted by ctr)
2.4 Top 100 Question(sorted by click times) 2.4 Top 100 Question(sorted by click times)
具体内容:以下所有数据都是首页的 具体内容:以下所有数据都是首页的
""" """
f.write(line) f.write(line)
f.write("#1. 比例特征\n") f.write("#1. 比例特征\n")
f.write("=================================================================\n") f.write("=================================================================\n")
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment