修改文件为多个文件并保存

    def new_data(train_data_path):
        with open(train_data_path, 'r') as f:
            lines = f.readlines()
            # 打乱数据
            np.random.shuffle(lines)
            with open("data/data9045/Newtraindata1.txt", 'a', encoding='utf-8') as ans1:
                with open("data/data9045/Newtraindata2.txt", 'a', encoding='utf-8') as ans2:
                    with open("data/data9045/Newtraindata3.txt", 'a', encoding='utf-8') as ans3:
                        for line in lines:
                            data, label = line.split('\t')
                            if int(label) in [3,4,5,6,7,12]: 
                                ans2.write(data+"\t"+label)
                                ans1.write(data+"\t"+str(14)+"\n")
                            else:
                                ans1.write(data+"\t"+str(15)+"\n")
                                ans3.write(data+"\t"+label)#label自带回车

train_data_path中的数据格式:在这里插入图片描述
其中值得注意的是if条件判断语句label必须转换为int型,之前使用过将后面的[3,4,5,6,7,12]转换成字符型[‘3’,‘4’,‘5’,‘6’,‘7’,‘12’],但得到的结果一直不是想要的,最后意识到,split(’\t’)切片之后的label不一定就是个单个字符,应该是int(label)+‘\n’的形式。

发布了9 篇原创文章 · 获赞 8 · 访问量 778

猜你喜欢

转载自blog.csdn.net/weixin_42076509/article/details/105196550