文字エンコーディングの私の理解

最近、物事にコーデックプロトコルの仕事をして、それが端末へのバイトのバイナリストリームとしてエンコードされたプライベートプロトコル文字内容に応じて必要です。GetBytesメソッドの文字列()メソッドを使用して直接電話番号を符号化するが、とき、端末、プログラマはどのようにこのバイナリコンテンツを復号化するために私に尋ねたとき、私は、文字エンコーディングの自分の理解について考えるようになりました。

最初に私はASSICリストの電話番号にコーディングソリューションが、それのこの厳密な解釈によると、直接の回答をご希望ですか?明らかに符号化されASSICを符号化するための文字列GetBytesメソッド()メソッドによってデジタル数の一連のように見えるんが、実際に起因するプログラミングの過失に、パラメータなしの方法により得られた符号化形式使用GetBytesメソッド()バイト配列を指定しない、あります符号化に使用するオペレーティングシステムのデフォルトのエンコーディングは、合意されたプロジェクトの契約に基づき、GBKコーディングではなくGetBytesメソッド(「GBK」)を使用する必要があります。GBKエンコーディングはコーディングASSICすると言うことはできません。

そこで問題は、GBKの符号化であるとの関係は何ASSICコーディング?なぜGBKは外のASSICでエンコードされた同じ電話番号をコードしますか?実際には、GBKとASSICは、2つの文字エンコーディングされ、ASSICは低7バイトコード文字を使用し、最上位ビットは常に0です。ASSICは、一般的に英語圏の国で使用される唯一のコード化された2 ^ 7 = 128文字の最古の使用のエンコーディングです。文字エンコーディング(簡体字中国語)のための中国の人々は、GBKコーディングを開発し、多くの記事、さらには書籍がGBKは、エンコードするために、静止使用などの2つのバイトを説明しますが、実際にのみASSICコーディング、互換性ASSIC符号化のため、ダブルバイトのコードGBK漢字を使います一つだけバイト文字を使用しています。それはASSICコーディング標準を含むGBKコーディング標準の使用、として理解することができ、ビットの周りに聞こえます。バイトが半分または完全なダブルバイト文字ASSICそれの漢字表記であれば問題は再び、GBKは、文字列を解釈コーディングコンピュータを使用して、どのように伝えるには?実際には、GBKエンコーディングの最初のバイトの最上位ビットが1のためになりますが、ASSICコーディングバイト最上位ビットが0であるので、コンピュータは最初の最上位ビットが1バイトで読んだとき、あなたはこのバイトを知っている前に言いましたそして次のバイトの漢字は、そうでない場合はASSIC文字です。

実際には、GBKのエンコーディングだけではなく、ほとんどの自然言語のコンピュータコードも互換ASSICコーディングされています。ASSICは、非常に汎用性の高い文字エンコーディングのように見えるUnicodeと非常に一般的な「コード」を思わ、その後、ASSICとUnicodeの関係は何ですか?ASSICは、最小セットでのコンピュータの文字エンコーディングがあり、そしてその最大のコード化文字セットの標準セットをコードUnicodeにしようとする場合、実際には、UnicodeがASSICない同じことで、Unicodeが一般的に使用される定義ビッグ(日本語と英語などで)世界UTF-8のように、テキストや記号のいかなる部分、大部分は、文字数定義バイナリ符号化方法ユニコードを示す、2つのバイトによってではなく、ユニコードGBK、ASSICとしてこの所定のバイナリ文字表現を表現することはできません具体的な実施基準が定義します。

私たちは、プレフィックスUTFのUTF-16、ユニコード変換フォーマット(ユニコード変換フォーマット)のフルネームUTF-8に精通している、Unicodeは実際のコーディングです。彼らは、バイナリコード化された番号にUnicode文字を意図するものではなく、符号化するためにUTF-16 2-4バイトを使用しているとUTF-8は、より多くのスペース、符号化されたバイト1-4の使用を節約することができます。UTF-8は、現在広く使用されている、それだけで1バイト、3つのバイトは、一般的に使用される漢字を示す場合互換ASSICエンコード文字ASSICの指標です。一部のプログラムは、それがUTF-8よりもわずかに2バイト文字を表し、国際的な家庭のGBKのエンコーディングを考慮し、より少ないスペースを必要としません。

一般的な文字エンコーディングの原理は、バイナリバイト指向プログラミングの原則は、いくつかは、彼はすぐには明らかにしませんでしたと言ったまで待ったときに文字指向プログラミング、心配しないで。これによって櫛、お互いを励まします。

おすすめ

転載: www.cnblogs.com/qingkongxing/p/11444208.html