ファイルの処理(A)
文字コード
文字(情報格納されているもの)()をコードします
キーボードは、現在の伝送である - >ホスト(RAM)は(01010101010として)現在の受信 - 「表示は、現在の受信(01010101010として - 」キーボード)
コード:01010101010--「キーボード
情報を格納するためのプロセスのテキストエディタ
テキストエディタ - 「テキストを書く - 」情報を保存します
ディスプレイ(メモリ) - 「(変換)ハードディスク
中文 --》 00101101001010
英語 - "111110000
トイレットペーパー - 「00000011111
コンピュータとの初期のアメリカの才能
0 - > A
1 - > B
0001 - > A
0011 - > B
...
1111 - >ワット
0000 0000 - > A
アスキー・コーディング - 「アメリカ人
# acill编码的转换关系的方法
print(chr(65))
print(ord('a'))
日本コンピュータを使用するには、だけでなく、韓国のコンピュータと、だけでなく、中国のコンピュータ
日本はまた、エンコーディングを作った - 「たわごと
0001 - > A
0010 - > B
韓国人もエンコーディングを作った - 「ファック
0001 - > C
0010 - > D
中国の人々はまた、エンコーディングを作った - 「GB2312
ドイツ - 「雌犬
000010倉(日本)000010ジン(中国)
>韓国(0001 0010 - - > CD)私は韓国語のコンピュータ( - > AB 0001 0010)に日本語で書きたい---「文字化けの現象の前に映画を見に
分割するために長い時間のために一緒に、「分裂の世界のトレンド長い期間 - 初期に、各国は様々な国でコンピュータを使用することができます
この時間は、ユニコード符号化(との対応関係)がありました
Unicodeのエンコードされた国は知っているかもしれません
どのようなハードドライブは、エンコードされたファイル形式を横たわって、Unicodeは、性交ユニコードを識別、その後ハードディスクからコーディング、および読書、あなたは日本の映画を見るあなたは2312を変換するUnicodeのヘルプを想定し、識別することができ、Unicodeを使用した、文字化けの問題を解決預金
ユニコードで撮影されており、Unicodeの預金で、以降のみUnicodeを書くことができ、コードを書いた - 「世界中のコードの後にユニコードです
ユニコードの時間とより多くのスペースを節約するので、そこにUTF8(Unicodeと唯一の対応が) - 「Unicodeのメモリフットプリントの問題を解決
今、すべてのコンピュータは、次のようにしている- 「メモリにユニコードを取るために、(ハード)とのutf8預金預金、コード/書き込み文書を書くために、世界中の人々がutf8であります
メモリはなぜUTF8ではありませんか?UTF8およびGB2312 /性交には変換関係しないので、メモリは、Unicodeに使用されます
将来遅かれ早かれ、メモリ使用UTF8
GBKのGB2312との違い
行の最初の使用は、一般的に伝統的な中国語の単語+で使用していません
GB2312 - 「一般的に使用される言葉
GBK - 「すべての単語
このノートブックのWindowsシステムのデフォルトのエンコードはすべてUTF8に加えて、GBKです
あなたはどのようなエンコーディングを読んで、コードを書くために
gbk--「文字化けして読み出し、書き込み、UTF8、UTF8での預金、
書かれたUTF8、GBKと預金、 - 「ゴミ、と読む - 」あなたは中国人のに日本のエンコードを探している場合を除き(中国のシンボルを、日本人ではありません、「」)
エンコードとデコード
メモリからハードディスクへのUnicodeエンコード---「(コーディング)UTF8
UTF8 - 「(復号化)ハードディスクからメモリユニコードへ
メモリは今だけのUnicodeエンコーディングです
Pythonインタプリタ(テキストエディタ)Pythonコード解釈処理
テキストエディタに対応する1 / Pythonのインタープリタ、コードインタプリタパイソンに読み込まれる - 「文字エンコーディング - 」python2デフォルトascill、のpython3デフォルトUTF8 - 「符号化ヘッダ
中文 # gbk编码的中文加
2 /識別コード - 「意味のあるプリント - 」構文問題
# coding:gbk # 告诉python解释器用gbk去完成第一步,读入字符
中文
「ターミナルを行く - - 」3 /結果を生成文字エンコーディングを
ターミナルは、機能を持っている:コンピュータ・コーディング、たどるものにコーディング、窓端子は、GBKは何です
エラーコードをコーディングすることに加えて、最初に#を追加 - *コーディング:UTF8の* -
エジソン(ビジネスマン) - 本発明の>王 - 「お金/他の人に使用することができます
18年の契約に署名するために彼を販売する40セントは、長期的に考えるために彼のライト、または40セントを、購入していた$ 2.50
Python2と符号化された差分のpython3
python2
python2メモリ変数の二つの形式、最初のものがあります:Unicodeは、2番目:コーディングの始まり
UTF8ストレージでのpythonを想定x='中文'
UTF8で、乱雑になりますが、xのGBK終わりを選ぶとき、バリアブルプリント(X)が、Windows端末のエンコード
Unicodeのストレージとoython2とし、ユニコードが端末によって受信され、ターミナルのWindows UTF8コーディングは重要ではありませんかGBK
python3
預金の形でのpython3唯一の変数、ユニコード
Unicodeのストレージとのpython3は、ユニコードは端末、端末、WindowsまたはGBKのUTF8文字化けしていないすべての権利、によって受信され、
lt = '中文' # == u'中文'2
print(lt1)