CSVファイルのインポートに関するさまざまな問題のまとめ

pythonで直接読み込んで(非推奨)、いろいろトランスコードして文字化けして、絵を描きたいならやはりDataFrameや配列に入れる必要があるので、わざわざ!ツールの使用においても、【深い理解と使いやすさを第一に求めない】【人が避けられるのであれば機械に負担をかけない】ことにこだわり続けています!以下はpythonでヘッドアイアンで発生した不具合の記録です。

①UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0xc8 をデコードできません: 無効な継続バイト、Unicode デコード エラー: "utf-8" コーデックは位置 0 のバイト 0xc8 をデコードできません: 無効な継続バイト。

STR はバイト単位で格納および転送され、すべてのバイトがディスクから読み取られますが、これを str に変換することはできず、python はエラーを報告します。

解決策①: encoding='unicode_escape' は、エンコードされた格納テキストを読み取るときに逆変換し、元のテキスト データを直接取得します。

解決策②: encoding='GB18030', GB18030 は少数民族を含む最新の中国語エンコーディングです。GB18030 は GBK および GB2312 と互換性があり、中国語の情報には GB18030 を直接使用することをお勧めします。

②ValueError: 名前またはタイトルとして既に使用されている名前。この名前は既に使用されています。テーブル ヘッダーに重複した名前がある場合、python はエラーを報告します。

これをきれいに行う方法は次のとおりです。

open+pd.read_csv() の場合、もちろんテーブルに漢字などはありませんので、開けないでください、無理はありません. 英語の数字でテーブルを作ることをお勧めします!

f = open(str) # str はファイル パス名です。必ず引用符を含めてください

pd.read_csv(f) # DataFrame データ型を生成すると、やりたいことが何でもできます

 

おすすめ

転載: blog.csdn.net/lizhyangmm/article/details/128013649