文字エンコーディング[の]学習のpython日二十から一

#文字エンコード:
バイナリ#中国の発展の
ASCII:英語のみとラテン文字に存在することができます。文字は1バイト、8占めている
1980年のわずか6,000漢字:GB2312
GBK1.0を:20,000以上の文字を保存し、1995年に
GB18030:以上27,000中国の2000年

のUnicodeユニコード:#ユニバーサル世界の仲介言語の
UTF-32:預金バイト4
UTF-16:/ 2バイト以上預金口座、65535、大半の保存することができ
UTF-8を:それを維持するために可変長バイト、英語ASCIIがで占められています1バイト、中国語の3バイト。

エンコードエンコード
デコードデコード

デフォルトのUnicode上のPython 3
れるデータ型のバイトに符号化しながらエンコードを
同時にデコードコードするタイプバイトはれる文字列に変換
B =バイト型バイト= = [0-255]

__Author: "hanhankeji" 
#1 DATE:2019年12月19日
インポート  SYS
 印刷(sys.getdefaultencoding()) ビュー8デフォルトエンコーディングUTF。 
S = " テスラ" 
印刷(S)
s_to_gbk = s.encode(" GBK " 印刷(s_to_gbk)
UTF-8 
テスラの
B '\ XCC \ xd8 \ XCB \ xb9 \ XC0 \ XAD'

  

おすすめ

転載: www.cnblogs.com/hanhankeji/p/12067684.html