diff --git a/diaryCandidateSet.py b/diaryCandidateSet.py
index 9789684c06020693f94dffa4acdcf74fae02b73c..24a21f665eec0b17122d864d3f10daaeac443928 100644
--- a/diaryCandidateSet.py
+++ b/diaryCandidateSet.py
@@ -7,12 +7,8 @@ from config import *
 # å€™é€‰é›†cidåªèƒ½ä»Žè®ç»ƒæ•°æ®é›†cidä¸é€‰æ‹©
 def filter_cid(df):
     data_set_cid = pd.read_csv(DIRECTORY_PATH + "data_set_cid.csv")["cid"].values.tolist()
-    print("è¿‡æ»¤å‰æ ·æœ¬å¤§å°:")
-    print(df.shape)
     if not df.empty:
         df = df.loc[df["cid"].isin(data_set_cid)]
-        print("è¿‡æ»¤åŽæ ·æœ¬å¤§å°:")
-        print(df.shape)
     return df
 
 
diff --git a/predictDiary.py b/predictDiary.py
index 371037a8b3430b02a8765f6eca9eda25456b6d71..5fb6ed2f69517cf125c77f98cbc76fc999641086 100644
--- a/predictDiary.py
+++ b/predictDiary.py
@@ -94,17 +94,19 @@ def router(device_id):
 
 if __name__ == "__main__":
     # TODO å¦‚æžœè€—æ—¶å°äºŽä¸€åˆ†é’Ÿï¼Œä¸‹ä¸€æ¬¡å–åˆ°çš„device_idå’Œä¸Šä¸€æ¬¡ç›¸åŒ
-
     while True:
         start = time.time()
         empty,device_id_list = get_active_users()
         if empty:
             time.sleep(10)
         else:
+            old_device_id_list = pd.read_csv(DIRECTORY_PATH + "data_set_device_id.csv")["device_id"].values.tolist()
             for device_id in device_id_list:
-                router(device_id)
-
+                if device_id in old_device_id_list:
+                    router(device_id)
+                else:
+                    print("è¯¥ç”¨æˆ·ä¸æ˜¯è€ç”¨æˆ·ï¼Œä¸èƒ½é¢„æµ‹")
             end = time.time()
             time_cost = (end - start)
-            print("é¢„æµ‹è€—æ—¶{}ç§’".format(time_cost))
+            print("è€—æ—¶{}ç§’".format(time_cost))
 
diff --git a/processData.py b/processData.py
index 01447d4649659f1e6b48d3d12e538b3dfbd4fa46..a442657dde7cfce25193549b1920b4e01059094b 100644
--- a/processData.py
+++ b/processData.py
@@ -60,6 +60,13 @@ def feature_en():
     print(cid_df.head(2))
     cid_df.to_csv(DIRECTORY_PATH + "data_set_cid.csv", index=False)
 
+    # å°†device_id ä¿å˜ã€‚ç›®çš„æ˜¯ä¸ºäº†åˆ¤æ–é¢„æµ‹çš„device_idæ˜¯å¦åœ¨è¿™ä¸ªé›†åˆé‡Œ,å¦‚æžœä¸åœ¨ï¼Œä¸éœ€è¦é¢„æµ‹
+    data_set_device_id = data["device_id"].unique()
+    device_id_df = pd.DataFrame()
+    device_id_df['device_id'] = data_set_device_id
+    print("data_set_device_id :")
+    print(device_id_df.head(2))
+    device_id_df.to_csv(DIRECTORY_PATH + "data_set_device_id.csv", index=False)
     return data, test_number, validation_number
 
 
@@ -99,8 +106,5 @@ def ffm_transform(data, test_number, validation_number):
     train.to_csv(DIRECTORY_PATH + "train{0}-{1}.csv".format(DATA_START_DATE, VALIDATION_DATE), index=False, header=None)
 
 
-if __name__ == "__main__":
-    data_fe = feature_en()
-    ffm_transform(data_fe)
 
 
diff --git a/train.py b/train.py
index 8163b5ec5b06f88ba61d460a1a01cdd46c6912a0..8ec2c5b8efb285c22b9af142b91238a5b3cbbc52 100644
--- a/train.py
+++ b/train.py
@@ -5,9 +5,10 @@ from diaryCandidateSet import get_eachCityDiaryTop3000
 
 # æŠŠæ•°æ®èŽ·å–ã€ç‰¹å¾è½¬æ¢ã€æ¨¡åž‹è®ç»ƒçš„æ¨¡åž‹ä¸²è”åœ¨ä¸€èµ·
 if __name__ == "__main__":
-    data_fe = feature_en()
-    ffm_transform(data_fe)
+    data, test_number, validation_number = feature_en()
+    ffm_transform(data, test_number, validation_number)
     train()
-    print('---------------prepare candidates--------------')
-    get_eachCityDiaryTop3000()
+    print("end")
+    # print('---------------prepare candidates--------------')
+    # get_eachCityDiaryTop3000()