test

c0e265ca · Your Name · 9076bcda · c0e265ca · c0e265ca
Commit c0e265ca authored Jun 24, 2019 by Your Name
Hide whitespace changes
Inline Side-by-side

Showing with 22 additions and 21 deletions

dist_predict.py eda/esmm/Model_pipline/dist_predict.py +21 -20

train.py eda/esmm/Model_pipline/train.py +1 -1

No files found.
--- a/eda/esmm/Model_pipline/dist_predict.py
+++ b/eda/esmm/Model_pipline/dist_predict.py
@@ -228,26 +228,27 @@ if __name__ == "__main__":
        # df = spark.read.format("tfrecords").load(path+"test_native/part-r-00000")
        # df.show()

-        te_files = []
-        for i in range(0,10):
-            te_files.append([path + "test_native/part-r-0000" + str(i)])
-        for i in range(10,100):
-            te_files.append([path + "test_native/part-r-000" + str(i)])
-
-        # te_files = ["hdfs://172.16.32.4:8020/strategy/esmm/test_native/part-r-00000"]
-
-        rdd_te_files = spark.sparkContext.parallelize(te_files)
-        print("-" * 100)
-        indices = rdd_te_files.repartition(100).map(lambda x: main(x))
-        # print(indices.take(1))
-        print("dist predict native")
-
-        te_result_dataframe = spark.createDataFrame(indices.flatMap(lambda x: x.split(";")).map(
-            lambda l: Row(sample_id=l.split(":")[0],uid=l.split(":")[1],city=l.split(":")[2],cid_id=l.split(":")[3],ctcvr=l.split(":")[4])))
-
-        # te_result_dataframe.show()
-
-        te_result_dataframe.repartition(50).write.format("parquet").save(path=path+"native_result/",mode="overwrite")
+        # te_files = []
+        # for i in range(0,10):
+        #     te_files.append([path + "test_native/part-r-0000" + str(i)])
+        # for i in range(10,100):
+        #     te_files.append([path + "test_native/part-r-000" + str(i)])
+
+        te_files = ["hdfs://172.16.32.4:8020/strategy/esmm/test_native/part-r-00000"]
+        main(te_files)
+
+        # rdd_te_files = spark.sparkContext.parallelize(te_files)
+        # print("-" * 100)
+        # indices = rdd_te_files.repartition(100).map(lambda x: main(x))
+        # # print(indices.take(1))
+        # print("dist predict native")
+
+        # te_result_dataframe = spark.createDataFrame(indices.flatMap(lambda x: x.split(";")).map(
+        #     lambda l: Row(sample_id=l.split(":")[0],uid=l.split(":")[1],city=l.split(":")[2],cid_id=l.split(":")[3],ctcvr=l.split(":")[4])))
+        #
+        # # te_result_dataframe.show()
+        #
+        # te_result_dataframe.repartition(50).write.format("parquet").save(path=path+"native_result/",mode="overwrite")

        print("耗时(秒)：")
        print((time.time()-b))

--- a/eda/esmm/Model_pipline/train.py
+++ b/eda/esmm/Model_pipline/train.py
@@ -383,7 +383,7 @@ if __name__ == "__main__":
    b = time.time()
    path = "hdfs://172.16.32.4:8020/strategy/esmm/"
    tf.logging.set_verbosity(tf.logging.INFO)
-    te_files = ["hdfs://172.16.32.4:8020/strategy/esmm/test_nearby/part-r-00000"]
+    te_files = ["hdfs://172.16.32.4:8020/strategy/esmm/test_native/part-r-00000"]
    print("hello up")
    result = main(te_files)
    df = pd.DataFrame(result,columns=["sample_id","uid","city","cid_id","pctcvr"])