符号化BOMなしUTF-8フォーマット

BOM - バイトオーダーマークは、バイトオーダーマークであります

UCSでの「ZERO WIDTH NO-BREAK SPACE」の文字は、そのエンコーディングがFEFFで、エンコーディングと呼ばれているがあります。FFFEは、UCSの文字には存在しないので、実際の送信には表示されません。UCSの仕様では、我々は最初の送信文字「ZERO WIDTH NO-BREAK SPACE」の前にバイトストリームを転送示唆しました。これは、リトルエンディアンバイトストリームであることを示すために、あなたはFFFEを受信した場合、受信者は、これはビッグエンディアンバイトストリームであることを示すために、FEFFを受けた場合。このように、文字 "ZERO WIDTH NO-BREAK SPACE" はまた、BOMと呼ばれています。

UTF-8 BOMは、バイト順序を示すために必要はありませんが、エンコーディングのBOMを示すために使用することができます。文字 "ZERO WIDTH NO-BREAK SPACE" UTF-8エンコーディングはEF BB BFあります。受信者は、バイトストリームの先頭にEF BB BFを受けた場合そのため、私は、これはUTF-8エンコーディングである知っています。

おすすめ

転載: www.cnblogs.com/gzpu/p/12334092.html