def new_data(train_data_path):
with open(train_data_path, 'r') as f:
lines = f.readlines()
# 打乱数据
np.random.shuffle(lines)
with open("data/data9045/Newtraindata1.txt", 'a', encoding='utf-8') as ans1:
with open("data/data9045/Newtraindata2.txt", 'a', encoding='utf-8') as ans2:
with open("data/data9045/Newtraindata3.txt", 'a', encoding='utf-8') as ans3:
for line in lines:
data, label = line.split('\t')
if int(label) in [3,4,5,6,7,12]:
ans2.write(data+"\t"+label)
ans1.write(data+"\t"+str(14)+"\n")
else:
ans1.write(data+"\t"+str(15)+"\n")
ans3.write(data+"\t"+label)#label自带回车
데이터의 train_data_path 형식 :
그것은, 조건문 라벨 int로 변환해야하는 경우에는 [3,4,5,6,7,12] 이후 [ '3'문자로 변환하기 전에 사용하는 것을 주목할 필요가있다 '4', '5', '6', '7', '12', 그러나 그 결과, 최종적으로 실현 분할 ( '\ t') 원했던되지 않은 레이블 슬라이스가 필요하지 않은 후 단일 문자, INT (라벨) + '\ n되어야 ' 형태.