テキストは、単語を使用する、まさにです

ファイルストリームの符号化を決定するのに必要な最初の3つのバイトを分析します。 

または使用 

StreamReaderをSR =新しいStreamReaderを( "ファイルパス"、/ * detectEncodingFromByteOrderMarks * /真)。 

ソフトウェアは、テキストを開いたときに通常、それ最初に行うべきことは、その単語のテキストを使用するかどうかを決定することです 

符号化文字はどんな節約するために設定します。ソフトウェアの文字セットとエンコーディングのテキストを決定する方法はいくつかありますが、 

ほとんどの標準的な方法は、ほとんどのテキストの最初の数バイトを検出することである、家主が見て、様々なフォーマットで保存異なるコーディングを学ぶことができます。例えば、 

 

まずバイト文字セット/エンコーディング 

 

EF BB BFのUTF-8 

 

FE FF UTF-16 / UCS-2、リトルエンディアン 

 

FF FE UTF-16 / UCS-2、ビッグエンディアン 

 

FF FE 00 00 UTF-32 / UCS-4、リトルエンディアン。 

 

00 00 FE FF UTF-32 / UCS-4、ビッグエンディアン。

 

おすすめ

転載: www.cnblogs.com/blogpro/p/11453875.html