update

4490b0c6 · 高雅喆 · 55fbd6b4 · 4490b0c6
Commit 4490b0c6 authored Nov 06, 2019 by 高雅喆
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 5 deletions

gyz_test.py eda/smart_rank/gyz_test.py +3 -5

No files found.
--- a/eda/smart_rank/gyz_test.py
+++ b/eda/smart_rank/gyz_test.py
@@ -10,7 +10,6 @@ from email.mime.application import MIMEApplication
 import redis
 import datetime
 from pyspark import SparkConf
-from pyspark import SparkContext
 import time
 from pyspark.sql import SparkSession
 import json
@@ -79,14 +78,13 @@ sparkConf = SparkConf().set("spark.hive.mapred.supports.subdirectories", "true")
    .set("spark.sql.extensions", "org.apache.spark.sql.TiExtensions") \
    .set("spark.tispark.pd.addresses", "172.16.40.170:2379").set("spark.io.compression.codec", "lzf") \
    .set("spark.driver.maxResultSize", "8g").set("spark.sql.avro.compression.codec", "snappy")
-sc = SparkContext()
-sqlContext = SparkSession(sc)
 spark = SparkSession.builder.config(conf=sparkConf).enableHiveSupport().getOrCreate()
 spark.sparkContext.setLogLevel("WARN")
 spark.sparkContext.addPyFile("/srv/apps/ffm-baseline_git/eda/smart_rank/tool.py")
 device_ids_lst_rdd = spark.sparkContext.parallelize(device_info)
 result = device_ids_lst_rdd.repartition(100).map(lambda x: get_user_service_portrait(x, all_word_tags, all_tag_tag_type, all_3tag_2tag, all_tags_name, size=None, pay_time=pay_time))
-result.collect()
+print(result.take(10))
-result.write.format('csv').save("~/test_df.csv")
+# result.write.format('csv').save("~/test_df.csv")
 spark.stop()