どのようにPythonの文字エンコーディングが起こっ鄭州の学習をベース

  鄭州のPythonベースの学習が優れていますか?それはどのように文字エンコーディングのですか?多くの初心者の学生Python文字列と文字エンコーディング無邪気に伝え、作業今日鄭州風水Pythonの先生は、あなたが関与コーディングの知識ポイントのPythonの文字を説明しました。

13183109-97cbd9ddd9094fbb.jpg

  1、基本的な考え方

  キャラクタ(文字)。コンピュータおよび通信分野では、文字情報の単位であり、それはそうで国別文字、句読点、グラフィック記号、数字、およびなどのテキストや記号の様々な、の総称です。例えば、文字、文字、句読点が文字です。

  文字セット(文字セット)は、文字、文字セットのより多くの種類のコレクションで、各文字セットに含まれる文字の数が異なっています。一般的な文字は、ASCII文字セット、GB2312の文字セット、Unicode文字セットを設定します。

  文字エンコード(文字コード)は、コンピュータ処理に固有のバイナリ数として符号化された文字セットを指します。一般的な文字エンコーディングのASCIIエンコーディング、Unicodeのエンコーディング、UTF-8エンコーディング、GBKコーディング。

  2、一般的な文字エンコーディングのプロフィール

  ASCIIエンコーディング

  1960年代、アメリカの文字符号化方式のセットを開発し、ASCIIとして知られている一般的な変換バイナリ関係の数、との文字、数字、記号の規定(米国標準コード情報交換、情報交換用米国標準コードのための)コード。ASCIIコードは128個のまたは256の可能な文字を表すために7つのまたは8進の組み合わせを指定しました。だから、ほとんどの場合、英語とバイナリ変換が非常に容易になります。

  Unicodeエンコーディング

  、ユニコードと呼ばれるこの符号化方式は、それがそれぞれにある統一された符号化方式に世界のすべての言語の人々が世界には他の言語を表現するために、ほぼ完全に異なる言語、ASCIIコードでは、十分ではありませんあなたは、クロスプラットフォームのテキスト処理言語を横断できるように、各言語の文字は、固有のバイナリコードを設定します。

  UTF-8エンコーディング

  UTF-8(8ビットユニコード変換フォーマット)は、例えば、ASCII文字は1バイト、アラビア語を使用して符号化を続け、ギリシャ文字を表すために、1〜4個のバイトを使用するUnicode文字エンコーディングのための可変長でありますテキストと2バイト、3つのバイトエンコーディング一般的に使用される漢字などを使用してコーディング他。

  コーディングGBK

  ASCII文字エンコーディングは、中国が中国語の文字を処理する方法で直面する問題へのコンピュータの後、中国の人々は自身がダブルバイト文字セットエンコーディングGB2312呼び出される、シングルバイトエンコーディングであり、これに基づいてGBKと呼ばれるものを作成しますコーディング、GBK 2748は漢字でなく、モンゴル、チベット、ウイグル、主要な民族の言語の集まりではないが含まれています。同様GBKも互換ASCII符号化文字を識別するために2バイトで表される英語の1バイト文字。

  Pythonのデフォルトエンコーディング

  Python2・デフォルト・エンコーディングはASCIIである、のpython3をコードするデフォルトではUTF-8です。Python2二つの関連型と文字列があります:STRおよびUnicode、彼らの親がbasestringされます。ここで、strの文字列は、符号化のいくつかの種類、ASCIIへのデフォルト、ありますがGBK、UTF-8など、Uを使用してUnicode文字列タイプ「...」図の形。

  全体的に、UTF-8はUnicode文字エンコーディングのための可変長のUnicodeの実装の一つです。STR型の間およびUnicodeの再計算にUnicode文字列操作、Python2常にみなさSTR復号(デコード)に含まれています。機能等は、クラスのオブジェクト型の文字列strを受信して​​いる場合がありますが、合格strの再計算Python2のデフォルトのタイプを使用してASCIIにコード化されたUnicode、です。

  より鄭州のPythonベースの学習の知識のために、私はあなたがより良いプロの学習を選択してくださいお勧めします。彼は最高であるために顔が直面するかどうかを選択する方法もいくつかの指導内容の学習環境からは、フィールドのオーディションに行きます。

ます。https://www.jianshu.com/p/f416c64ab714で再現

おすすめ

転載: blog.csdn.net/weixin_34061482/article/details/91228547