def new_data(train_data_path):
with open(train_data_path, 'r') as f:
lines = f.readlines()
# 打乱数据
np.random.shuffle(lines)
with open("data/data9045/Newtraindata1.txt", 'a', encoding='utf-8') as ans1:
with open("data/data9045/Newtraindata2.txt", 'a', encoding='utf-8') as ans2:
with open("data/data9045/Newtraindata3.txt", 'a', encoding='utf-8') as ans3:
for line in lines:
data, label = line.split('\t')
if int(label) in [3,4,5,6,7,12]:
ans2.write(data+"\t"+label)
ans1.write(data+"\t"+str(14)+"\n")
else:
ans1.write(data+"\t"+str(15)+"\n")
ans3.write(data+"\t"+label)#label自带回车
データのtrain_data_pathフォーマットは:
それは、条件文のラベルはintに変換されなければならない場合は、[3,4,5,6,7,12]後で[「3」文字に変換する前に使用したことは注目に値します「4」、「5」、「6」、「7」、「12」]が、結果は望んだされていない、最終的に実現し、スプリット(「\ T」)ラベルスライスは、必ずしもではない後単一の文字は、INT(ラベル)+ '\ nはあるべき ' フォーム。