def new_data(train_data_path):
with open(train_data_path, 'r') as f:
lines = f.readlines()
# 打乱数据
np.random.shuffle(lines)
with open("data/data9045/Newtraindata1.txt", 'a', encoding='utf-8') as ans1:
with open("data/data9045/Newtraindata2.txt", 'a', encoding='utf-8') as ans2:
with open("data/data9045/Newtraindata3.txt", 'a', encoding='utf-8') as ans3:
for line in lines:
data, label = line.split('\t')
if int(label) in [3,4,5,6,7,12]:
ans2.write(data+"\t"+label)
ans1.write(data+"\t"+str(14)+"\n")
else:
ans1.write(data+"\t"+str(15)+"\n")
ans3.write(data+"\t"+label)#label自带回车
train_data_path formato de los datos:
Vale la pena señalar que si la etiqueta sentencia condicional debe ser convertido a un int, utilizado antes de la [3,4,5,6,7,12] más tarde convertido en el personaje [ '3', '4', '5', '6', '7', '12'], pero el resultado no ha sido buscado, finalmente se dio cuenta, split ( '\ t') etiqueta después de la rebanada no es necesariamente una un solo carácter, debe ser int (etiqueta) + '\ n ' forma.