Python 実装は、ドキュメント内のすべての空白文字をコンマに置き換えます

科学計算では、入力データのファイル形式の変換は頻繁に発生する問題です。データ入力担当者の非標準的な入力方法により、さまざまなタブ文字 (\t)、スペースの混合使用などが一般的な問題です。次の形式のようなデータを含むテキスト ファイル (txt) を読み取る小さな例を次に示します。

日付 d1 d2、エラー 平均名
2017/1/1 で
2017/1/2 で
固有

これらのデータは空白文字で区切られていますが、空白文字には空のスペースの倍数ではないスペースが含まれており、一部にはタブも含まれているため、これ以上のデータ分析が困難になります.今、pythonの文字列関数、正則化などを介して、アプリケーションはデータ形式を標準の CSV 形式に変換します。コードは以下のように表示されます:

import re
f2 = open('Rn.csv', 'w')    # 是你转换后要存储的地址
with open('data1.txt', 'r') as f1:    # data1.txt是你想转换的文件
    for i in f1:
        line = re.split('\s+', i) #将字符串i以全部空白字符为分割符,将其分割成一个字符列表
        new_line = ','.join(line) # 将字符列表用','拼接成一个新字符串
        new_line = new_line.strip(',') # 将新字符串尾部产生的','去掉
        print(new_line)
        f2.write(new_line)
f2.close()

変換後の Rn.csv ファイルのデータ形式は次のとおりです。

date,d1,d2,error,ave,name
2017/1/1,in,in,in,in,in
2017/1/2,in,in,in,in,in
2017/1/3,in,in 、で、で、で

        ここでは、.txt と .csv の 2 つの形式を変換できるだけでなく、他の形式も可能です.目的は、スペースからコンマへの変換を一括で完了することです。

おすすめ

転載: blog.csdn.net/weixin_64338372/article/details/129856091