pythonで直接読み込んで(非推奨)、いろいろトランスコードして文字化けして、絵を描きたいならやはりDataFrameや配列に入れる必要があるので、わざわざ!ツールの使用においても、【深い理解と使いやすさを第一に求めない】【人が避けられるのであれば機械に負担をかけない】ことにこだわり続けています!以下はpythonでヘッドアイアンで発生した不具合の記録です。
①UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0xc8 をデコードできません: 無効な継続バイト、Unicode デコード エラー: "utf-8" コーデックは位置 0 のバイト 0xc8 をデコードできません: 無効な継続バイト。
STR はバイト単位で格納および転送され、すべてのバイトがディスクから読み取られますが、これを str に変換することはできず、python はエラーを報告します。
解決策①: encoding='unicode_escape' は、エンコードされた格納テキストを読み取るときに逆変換し、元のテキスト データを直接取得します。
解決策②: encoding='GB18030', GB18030 は少数民族を含む最新の中国語エンコーディングです。GB18030 は GBK および GB2312 と互換性があり、中国語の情報には GB18030 を直接使用することをお勧めします。
②ValueError: 名前またはタイトルとして既に使用されている名前。この名前は既に使用されています。テーブル ヘッダーに重複した名前がある場合、python はエラーを報告します。
これをきれいに行う方法は次のとおりです。
open+pd.read_csv() の場合、もちろんテーブルに漢字などはありませんので、開けないでください、無理はありません. 英語の数字でテーブルを作ることをお勧めします!
f = open(str) # str はファイル パス名です。必ず引用符を含めてください
pd.read_csv(f) # DataFrame データ型を生成すると、やりたいことが何でもできます