文字エンコーディングのコーミング

コンピュータの基礎知識

  1. CPU:メモリデータから削除プログラム(テキストエディタの動作を制御するメモリに読み込まれます
  2. メモリ:プログラムを実行します(CPUた後の動作、テキストエディタでデータを格納するメモリ)
  3. ハード:保存データ(テキストエディタ)

原則として、テキストエディタ、ファイルへのアクセス

  1. エディタで内容を書くためにも、データの損失停電後、メモリに格納されているので、それは、メモリ内にある、プロセスを開始するために開くエディタを開きます。
  2. ハードディスクへのブラシエディタメモリデータ:永久に保存するには、[保存]ボタンをクリックする必要があります。
  3. 私たちは、私は文字だけの束を書いて、他の文書の作成と違いはありません、(実装されていない)PYファイルを書き込みます。

  4. 役割:データを保存し、データを読み書き

ファイルを実行するためのステップ3 PYのPythonインタプリタ

  • 第一段階:Pythonインタプリタを起動し、その後、テキストエディタの同等を開始
  • 第二段階:ハードディスクtest.pyファイルの内容から、テキストエディタのPythonインタプリタ相当、メモリに、(文字エンコーディングを含む)test.pyの内容を読み取ります
  • 第三段階:ちょうどハードディスクから検索された実行内容(生成変数は、変数、メモリ記憶装置に格納された変数を格納するためのメモリ空間を開くには、文字エンコーディングを含みます)

類似点と相違点Pythonインタプリタとテキストの編集

  • 同じポイント:Pythonインタプリタは、テキストエディタと同じですPYファイル機能を、読んだことがあるので、Pythonインタプリタは、ファイルの内容を解釈しています。
  • 異なる点:表示または編集するために、テキストエディタ、メモリへのファイルの内容は、単にPythonの構文を無視しますが、PythonインタプリタはないPythonコードを書くことであなたにのぞき見を与えるために、メモリに内容を提出します何が、Pythonの構文を識別し、Pythonのコードを実行します。

文字コード

文字エンコーディングは、あなたが知ることができ、バイナリと文字の間で相互変換するプロセスです

我々が原因のエンコード形式に、実行するためにメモリに、ハードディスクのファイルをハードディスクGBK / UTF8 /アスキーファイルを築く際に早期一様ではない、それは読むことができないので、ユニコードのコードがあった、彼は状況を認識することができ、すべてのコーディングあなたのハードディスク上の状況Unicodeファイルを読み込むためのメモリ。ファイルのユニックを形成するには、メモリ、ハードドライブに読み込まれますが、Unicodeは、より多くのメモリを占有しますので、Unicodeの状況は、コードの貯蓄のUTF8コード形式に変換され続けスペース

どちらの場合も、文字化け

中国語テキストエディタは唯一の中国を知って、あなたは日本人を入力 - >文字化けコーディング#encode

テキストエディタの店舗中国語(ファイル)が、あなたは日本のエディタでファイルを開く - >デコード文字化け#decode

ごみを解決

どのようなストレージ・フォーマット、フォーマットを読むためには何も、それが文字化けすることはありません!

Windowsのメモ帳のコンピュータのデフォルトは、他のソフトウェアのデフォルトのエンコーディングに加えて、UTF8のエンコードをGBKします

python3(理解)

あなたはそれが実際にユニコードで見ます

しかし、あなたは、このターミナルUnicodeのゼロを置く助けと変換を行い、ユニコード端子から変換すると、エンコーディング形式を識別することができ、その後、中国に変わっします

# coding:gbk
a = '中文'  # 用unicode编码存储了这堆0和1
print(a)  # 010101010

デフォルトのエンコーディングは、エンコードされた変数は、Unicodeを認識し、端末GBKと仮定する

デフォルトエンコーディングが想定されている端末UTF8、Unicodeのエンコーディング変数意識

Python2(理解)

指定された符号化ユニコード+(STR型)をコードします

# coding:gbk
a = '中文'  # 用gbk编码存储了这堆0和1
a = u'中文'  # 用unicode编码存储了这堆0和1
print(a)

ターミナルは、デフォルトのエンコードされるテキストエディタです。

デフォルトのエンコーディングは、端末GBK、変数ノウハウをコードGBKと仮定されます

デフォルトのコードは、端末UTF8は、エンコードされた変数は、GBKを知らないことが想定されます

おすすめ

転載: www.cnblogs.com/aden668/p/11316186.html