[予約] UNICODEとASCIIの間の差

オリジナル住所:https://blog.csdn.net/lx697/article/details/5914417

国際化の問題に関連し、最近のプロジェクトは、Unicodeエンコーディングと事前に接触するので、そのため、プロジェクト期間中に、ASCIIおよびUNICODEにいくつかの情報を収集しました。

 

1.ASCII機能

 

     ASCIIは、仕様をコードする英語の文字を表すために使用されます。各ASCII文字は1つのバイトを占有し、従って、ASCIIコードで表すことができる文字の最大数は255(00H-FFH)です。( - 7FH、最上位ビットが0である00H)これは、最初に128を使用している一般的にどのような問題はありません、英語のためです。そして最上位ビットが1と他のキャラクタ128(80H-FFH)であり、「ASCIIが拡張」と呼ばれ、一般に英語のタブを格納するために使用される、表音文字及びその他の記号などの一部。

     しかし、このような中国の、255文字のような、より複雑な言語のために、それは明らかに十分ではありません。その結果、様々な国では、符号化規格漢字は「GB2312-80」と呼ばれ、それがASCIIエンコード標準と互換性があり、実際には、本当にこの、置くAを標準化し、拡張ASCIIを利用していない標準をコードする、独自のテキストを開発しました2つの拡張ASCII文字と漢字はASCIIコードのセクションを区別するために、表現します。
     しかし、この方法では問題があり、最大の問題は、ASCII文字エンコーディングと中国のオーバーラップの拡大です。テーブル、中国のシステムで使用されるようなソフトウェアを描画するために英語のタブのASCIIコードを拡張多くのソフトウェアの使用は、これらのテーブルは文字化け漢字と誤解されます。また、国や地域のために情報の国や地域交流を与えるお互いに競合が、多くの問題をもたらしていることを自分自身の文字符号化規則を持っています。

 

2.UNICODE生成

     本当にこの問題を解決するために、拡張ASCIIの観点から、新しいコーディングシステムとしてUNICODEがされて入ってきた、それは中国語、フランス語、ドイツ語のテキストのすべてのことができない......など統一考慮に、両方の各文字について別々のコードを割り当て。

 

3. UNICODE何ですか

      それは世界のすべての言語をエンコードに対応することができ、2バイト(0000H-FFFFH)、ホールド65,536文字を、取りとしてASCIIとUnicodeの文字エンコード方式です。ユニコードでは、すべての文字が独特のUnicodeコードを持つ文字によって処理されます。

 

4. UNICODEを使用するメリット

      使用Unicodeエンコーディングは、あなたの国際的なプロジェクトを作成し、プロジェクトが複数の言語をサポートすることができます。すなわち、異なる言語での歪みシステムを招くことなく


おすすめ

転載: www.cnblogs.com/it774274680/p/12059105.html