記事ディレクトリ
序文
コードでテキストデータを扱う場合、最も厄介な点はエンコーディングの問題であり、この目標を達成するのに役立つ多くのライブラリが錆びています。
1. テキストのエンコーディングを推測する
1つ目は、バイト配列のエンコーディングが何であるかを推測することです
使用するライブラリは次のとおりです。chardetng
まず、その依存関係を依存関係に追加する必要があります。
[dependencies]
chardetng = "0.1.17"
次にコマンドを実行するcargo build
と、自動的にダウンロードされてコンパイルされます
当て推量のステップが 1 つしかないため、比較的簡単に使用できます。
最も単純なプログラムは次のとおりです。
use chardetng::EncodingDetector;
fn main