必要なプログラミングの基礎知識|コンピュータ組成記事の原則(06):文字セットとエンコーディングコンピュータ

大学生におけるいくつかの非専攻が懸念されるため、コンピュータの知識ベースでは、それは彼らの心の痛みとなっており、技術教育の学生のために、仕事の後、多くの学生が、また欠点を認識しており、戻りたい、自分自身の知識が不足していますブブの基本。多くの複雑なコンピュータベースのコンテンツのコースが、それは本や大学のコースであるかどうかは、仕事外のビットです。特に、数多くの基本的なコンピュータの知識では、ゼロまたはレビューから学びたいが時間がかかります。

そこで、この連載は、3つの基本的なコンピュータの知識エリアカバー、プログラミングの必要な基本的な知識を補うために速く行くことができます:コンピューター組成原理、オペレーティング・システム、コンピュータネットワークを、これらは最も重要なコンテンツ内の大学のコンピュータのコースです。記事の内容とは、知識を必要としない、プログラマとして捨てられた精製概要を、行います。

目的は次のとおりです。

  • あなたはコンピュータアーキテクチャの知識の形成を助けます
  • あなたがコンピュータの基本的な原理を理解するのに役立ち
  • あなたは優れたデザインの実用的な作業場所を学ぶのを助けます

Benpianは、コンピュータの文字エンコーディングは、の原則にコンピュータを設定しています。

注意、前方、お気に入り、コメントを歓迎

文字エンコーディングの歴史

ASCIIコード

ASCIIコードの場合、私は、勉強、仕事の通常の過程で私たちを信じて理解する必要があります。

ASCIIコード、英語での完全な名前:情報交換用米国標準コードは、翻訳がある:情報交換用米国標準コード、我々は通常、一般的なコーディングに使用されます。それはどのようにについて来るのでしょうか?

コンピュータでは、すべてのデータが二進数を記憶し、B、C、D、文字52として、例えば、(コンピュータ1と、それぞれ高及び低0によって表される)の計算は、発現された場合に使用しなければなりませんコンピュータに格納されている(含む資本)と(例えば、*、#、@など)0,1その他のデジタルあり、いくつかの一般的な記号はまた、もちろん、すべてを示す2進数とシンボルとどの特定のバイナリ数字を表すために使用され文字A、0001ビル・ゲイツのために表現したい場合など個人は、(これはエンコーディングと呼ばれている)一連の規則所有することができ、そしてジョブズCEOは、通信中に、彼らはお互いを理解することはできません誰を発現しないために0010を使用していました言語。そのため、混乱を招くことなく、相互に通信するコンピュータに、あなたはその後、米国は、ASCIIコード化、上記の共通のシンボルが進数を表すために使用される統一規則の導入を標準化団体に関連する、同じ符号化規則を使用する必要があります。

標準のASCIIコード、また、すべての大文字、小文字、数字0〜9、句読点、およびアメリカ英語で使用される特殊制御文字を表すために7ビットを用いて、基本的なASCIIコードと呼ばれ、7128の合計(2を定義パワー)の文字

今、私たちは、ASCIIテーブルの部分を通って理解しています。

テーブルのようなASCIIコードの一般的な文字、一覧表示されます:文字が01100001のように表されるが、文字(ない番号オハイオ州)1は、00110001のように表現しました... ...

早期では、コンピュータのASCIIコードは、人々の特定のグループを満たすことができるようになります、しかし、コンピュータとコンピュータの普遍的な発展として、ASCIIコードは、このようないくつかの国のいくつかの数学記号や記号などの人々のニーズを満たすことができないことはできません表現。だから、人々のASCIIコードは、ASCIIコードを拡張ASCIIコードが256個の文字を表現することができます拡大することで、文字を表すために8ビットで拡張されました。

拡張ASCIIコード

次の図は、ASCIIコード表を拡大することです。

これは、表音文字やヨーロッパの他のシンボル、テーブルのシンボルで、一般的な算術演算子が含まれています。コンテンツをコンピュータで表現することができるように、大幅に拡大元のコードテーブルを補完するために使用されるASCIIコードはますます多様になってきています。

文字エンコーディングの国際化

コンピュータの更なる発展に伴い、ますます多くの国がコンピュータの使用の仲間入りをし、文字エンコーディングの需要はますます高く設定します。ヨーロッパの国々のために、中央アジア、東アジア、ラテンアメリカ、彼らは豊かな言語です、システムは同じではありません、文字の組み合わせに限定されるものではなく、特に中国、韓国、日本およびその他の言語の中で最も複雑な、ASCIIコード表はできませんこれらの言語の表現は、国際的な文字エンコーディングセットで新しいコードセットを、使用することが急務となっています。

中国のコードセット

GB2312

漢字符号化の国家規格を開発するGB2312 1980年、中国の6763と682以外の文字を含む7445文字の合計を、符号化する最古の最も包括的なセットで、文字は2つのバイトを占めています。

GBK

GB2312は国際基準を満たしていないので、中国の科学者は、1995年に--GBKセットエンコーディングの完全な第2のセットを発売し、GBK GB2312下位互換性は、国際的なISO規格をサポートし、21003の中国語の文字が含まれている、すべてのCJK文字のサポート。

GB2312とGBKは比較的完全なコードセットされている、しかし、彼らは唯一のローカライズされたコーディングされ、中国での使用には問題ありませんが、国境を越えた使用は問題を抱えています。例えば、中国の人は、このサイトを訪問し、外国人の友人をウェブサイトを開発し、彼らが利用できない場合は、ローカルGB2312 GBKコードセットまたはコードセットがインストールされ、それらはアクセスしたWebサイトが文字化けしますときに表示します。したがって、私たちは世界統一のコーディング標準を必要とします。

ユニコード

すべてのUnicode文字の場合、Unicodeはされて入ってきました。Unicodeは、世界的なシンボルセットを定義し、あなたは世界でテキストや文字のすべてを表現することができ、世界的な互換性の文字セットです。あなたはゴミ問題を持っていないので、すべてのUnicode言語は、セット符号化方式に統一されています。

我々は通常、UTF-8エンコーディングがUTF-8エンコーディングを推奨されているUnicodeをエンコードするバイトで、通常はコードを書くのルールの一つである使用します。Windowsオペレーティングシステムのデフォルトを使用して、中国のGBKのエンコーディングは、それゆえ、プログラミングIDEの使用は、典型的にはUTF-8エンコーディングを配置されています。

終わり

おすすめ

転載: www.cnblogs.com/sum-41/p/11516651.html