どのような考えを持っているだろうかPython文字列の言及を紹介

  あなたが思うだろうかPythonの?Python文字列言及、?への導入はASCII、またはUnicodeとは何ですか?どのように違い?次小扁は、あなたは、Pythonを共有したとは何それらの間の遷移?エンコードされた文字列と文字列です文字列に関する知識を学ぶ入門。

  1、文字とバイト

  1バイト文字と等価ではない、文字が様々な方法を表すことができ、シンボルを認識できる人間は、異なる表現は、バイトの別の番号を使用しています。このような文字としてAZは、ASCIIコード(1バイト)で表すことができ、また、Unicodeで(2バイト)で表すことができ、それはまた、UTF-8(1バイト)で表すことができます。

  役割は、人間の認識文字と、逆のプロセスバイトコードの機械可読の文字コードを変換することです。Unicodeは、GBK文字コードのようなバイト列で、ASCII文字列で表さ本当、UTF-8です。

  図2に示すように、符号化と復号化

  復号化(デコード)バイトの特定文字列が対応する文字コードに変換され、Unicodeで、例えば、(エンコード)をコードする(コードポイント)変換処理及び規則に対応する特定の文字列をエンコードするバイトのUnicode文字列でありますUnicode文字列(コードポイント)プロセスおよびルール。

  符号化または復号化するかどうか、それが重要な要因は、特定の文字エンコーディングである必要があり。ほとんどの場合、バイト、文字エンコーディングの異なる数で符号化された文字のバイト値が異なるためであり、その逆もまた同様です。

  3、Pythonのトランスコーディング

  PythonのデフォルトのエンコードタイプはUTF-8、Python2をコードするデフォルトはASCIIです、漢字が認識できない、明示的に文字エンコーディングを指定する必要があり、Unicodeののpython3のデフォルトのエンコーディングは、中国語の文字を識別することができます。

  ユニコードを通過するPythonの異なるエンコーディング変換、UTF-8またはGBKのいずれかで、全体のプロセスは、UnicodeはUnicodeエンコード形式は、現在あるものを教えて、その後、変換を変換してエンコードされたエンコード・デコードをデコードすることによって、自分自身のために考えることです達成されるべきフォーマットまたはタイプをコードします。

  図4に示すように、一般的なコーディングエラーの理由

  1)デフォルトでは、Pythonのインタープリタコード

  2)Pythonソースファイルのエンコーディング

  3)端末は、符号化のために使用しました

  4)オペレーティングシステムの言語設定

  作为人工智能时代的最佳编程语言,Python吸引了广泛关注,选择学习Python的人日益增多。尽管Python入门简单,但企业的高要求促使越来越多的人参加专业系统学习并积累实战经验。


おすすめ

転載: blog.51cto.com/14551723/2476228