python 去除txt文本中的空格、数字、特定字母等

使用场景:需要去除txt文本中的空格、数字、特定字母等。

需要修改的txt文本叫做:train.txt
修改之后保存成:train_output.txt

# ecoding=utf-8
ifn = r"train.txt"
ofn = r"train_output.txt"

infile = open(ifn,'rb')
outfile = open(ofn,'wb')

for eachline in infile.readlines():
        #去掉文本行里面的空格、\t、数字(其他有要去除的也可以放到' \t1234567890'里面)
        lines = filter(lambda ch: ch not in ' \t1234567890', eachline) 

        outfile.write(lines) # 写入train_output.txt(此处是一股脑的全写进去,并没有做任何的分行处理)

infile.close
outfile.close

猜你喜欢

转载自blog.csdn.net/lanyuelvyun/article/details/76991067