ファイルの処理(A)

ファイルの処理(A)

文字コード

文字(情報格納されているもの)()をコードします

キーボードは、現在の伝送である - >ホスト(RAM)は(01010101010として)現在の受信 - 「表示は、現在の受信(01010101010として - 」キーボード)

コード:01010101010--「キーボード

情報を格納するためのプロセスのテキストエディタ

テキストエディタ - 「テキストを書く - 」情報を保存します

ディスプレイ(メモリ) - 「(変換)ハードディスク

中文 --》 00101101001010

英語 - "111110000

トイレットペーパー - 「00000011111

コンピュータとの初期のアメリカの才能

0 - > A

1 - > B

0001 - > A

0011 - > B

...

1111 - >ワット

0000 0000 - > A

アスキー・コーディング - 「アメリカ人

# acill编码的转换关系的方法
print(chr(65))
print(ord('a'))

日本コンピュータを使用するには、だけでなく、韓国のコンピュータと、だけでなく、中国のコンピュータ

日本はまた、エンコーディングを作った - 「たわごと

0001 - > A

0010 - > B

韓国人もエンコーディングを作った - 「ファック

0001 - > C

0010 - > D

中国の人々はまた、エンコーディングを作った - 「GB2312

ドイツ - 「雌犬

000010倉(日本)000010ジン(中国)

>韓国(0001 0010 - - > CD)私は韓国語のコンピュータ( - > AB 0001 0010)に日本語で書きたい---「文字化けの現象の前に映画を見に

分割するために長い時間のために一緒に、「分裂の世界のトレンド長い期間 - 初期に、各国は様々な国でコンピュータを使用することができます

この時間は、ユニコード符号化(との対応関係)がありました

Unicodeのエンコードされた国は知っているかもしれません

どのようなハードドライブは、エンコードされたファイル形式を横たわって、Unicodeは、性交ユニコードを識別、その後ハードディスクからコーディング、および読書、あなたは日本の映画を見るあなたは2312を変換するUnicodeのヘルプを想定し、識別することができ、Unicodeを使用した、文字化けの問題を解決預金

ユニコードで撮影されており、Unicodeの預金で、以降のみUnicodeを書くことができ、コードを書いた - 「世界中のコードの後に​​ユニコードです

ユニコードの時間とより多くのスペースを節約するので、そこにUTF8(Unicodeと唯一の対応が) - 「Unicodeのメモリフットプリントの問題を解決

今、すべてのコンピュータは、次のようにしている- 「メモリにユニコードを取るために、(ハード)とのutf8預金預金、コード/書き込み文書を書くために、世界中の人々がutf8であります

メモリはなぜUTF8ではありませんか?UTF8およびGB2312 /性交には変換関係しないので、メモリは、Unicodeに使用されます

将来遅かれ早かれ、メモリ使用UTF8

GBKのGB2312との違い

行の最初の使用は、一般的に伝統的な中国語の単語+で使用していません

GB2312 - 「一般的に使用される言葉

GBK - 「すべての単語

このノートブックのWindowsシステムのデフォルトのエンコードはすべてUTF8に加えて、GBKです

あなたはどのようなエンコーディングを読んで、コードを書くために

gbk--「文字化けして読み出し、書き込み、UTF8、UTF8での預金、

書かれたUTF8、GBKと預金、 - 「ゴミ、と読む - 」あなたは中国人のに日本のエンコードを探している場合を除き(中国のシンボルを、日本人ではありません、「」)

エンコードとデコード

メモリからハードディスクへのUnicodeエンコード---「(コーディング)UTF8

UTF8 - 「(復号化)ハードディスクからメモリユニコードへ

メモリは今だけのUnicodeエンコーディングです

Pythonインタプリタ(テキストエディタ)Pythonコード解釈処理

テキストエディタに対応する1 / Pythonのインタープリタ、コードインタプリタパイソンに読み込まれる - 「文字エンコーディング - 」python2デフォルトascill、のpython3デフォルトUTF8 - 「符号化ヘッダ

中文 # gbk编码的中文加

2 /識別コード - 「意味のあるプリント - 」構文問題

# coding:gbk  # 告诉python解释器用gbk去完成第一步,读入字符
中文

「ターミナルを行く - - 」3 /結果を生成文字エンコーディングを

ターミナルは、機能を持っている:コンピュータ・コーディング、たどるものにコーディング、窓端子は、GBKは何です

エラーコードをコーディングすることに加えて、最初に#を追加 - *コーディング:UTF8の* -

エジソン(ビジネスマン) - 本発明の>王 - 「お金/他の人に使用することができます

18年の契約に署名するために彼を販売する40セントは、長期的に考えるために彼のライト、または40セントを、購入していた$ 2.50

Python2と符号化された差分のpython3

python2

python2メモリ変数の二つの形式、最初のものがあります:Unicodeは、2番目:コーディングの始まり

UTF8ストレージでのpythonを想定x='中文'UTF8で、乱雑になりますが、xのGBK終わりを選ぶとき、バリアブルプリント(X)が、Windows端末のエンコード

Unicodeのストレージとoython2とし、ユニコードが端末によって受信され、ターミナルのWindows UTF8コーディングは重要ではありませんかGBK

python3

預金の形でのpython3唯一の変数、ユニコード

Unicodeのストレージとのpython3は、ユニコードは端末、端末、WindowsまたはGBKのUTF8文字化けしていないすべての権利、によって受信され、

lt = '中文' # == u'中文'2
print(lt1)

おすすめ

転載: www.cnblogs.com/hj59988326/p/11536118.html