change test file

ee789e40 · 张彦钊 · 2fe3223d · ee789e40 · ee789e40
Commit ee789e40 authored May 24, 2019 by 张彦钊
Hide whitespace changes
Inline Side-by-side

Showing with 20 additions and 9 deletions

feature_engineering.py tensnsorflow/feature_engineering.py +5 -0

multi.py tensnsorflow/multi.py +15 -9

No files found.
--- a/tensnsorflow/feature_engineering.py
+++ b/tensnsorflow/feature_engineering.py
@@ -36,6 +36,11 @@ def multi_hot(df,column,n):
    return number,app_list_map
+def get_map():
+    db = pymysql.connect(host='172.16.40.158', port=4000, user='root', passwd='3SYz54LS9#^9sBvC', db='jerry_test')
+    sql = "select max(stat_date) from esmm_train_data"
+    validate_date = con_sql(db, sql)[0].values.tolist()[0]
 def feature_engineer():
    db = pymysql.connect(host='172.16.40.158', port=4000, user='root', passwd='3SYz54LS9#^9sBvC', db='jerry_test')
    sql = "select max(stat_date) from esmm_train_data"

--- a/tensnsorflow/multi.py
+++ b/tensnsorflow/multi.py
@@ -150,15 +150,21 @@ if __name__ == '__main__':
    # [path + "tr/part-r-00000"]
    import subprocess
-    spark = SparkSession.builder.getOrCreate()
+    # spark = SparkSession.builder.getOrCreate()
-    b = [("a", 1), ("a", 1), ("b", 3), ("a", 2)]
+    # b = [("a", 1), ("a", 1), ("b", 3), ("a", 2)]
-    rdd = spark.sparkContext.parallelize(b)
+    # rdd = spark.sparkContext.parallelize(b)
-    df = spark.createDataFrame(rdd).toDF("id", "n")
+    # df = spark.createDataFrame(rdd).toDF("id", "n")
-    df.show()
+    # df.show()
-    df.createOrReplaceTempView("df")
+    # df.createOrReplaceTempView("df")
-    t = spark.sql("select id from df").map()
+    # t = spark.sql("select id from df").map()
-    print(t)
+    # print(t)
+    db = pymysql.connect(host='172.16.40.158', port=4000, user='root', passwd='3SYz54LS9#^9sBvC', db='jerry_test')
+    sql = "select device_id from esmm_train_data limit 10"
+    cursor = db.cursor()
+    cursor.execute(sql)
+    result = cursor.fetchall()
+    a = list(result)
+    print(a)