#文字エンコード:
バイナリ#中国の発展の
ASCII:英語のみとラテン文字に存在することができます。文字は1バイト、8占めている
1980年のわずか6,000漢字:GB2312
GBK1.0を:20,000以上の文字を保存し、1995年に
GB18030:以上27,000中国の2000年
のUnicodeユニコード:#ユニバーサル世界の仲介言語の
UTF-32:預金バイト4
UTF-16:/ 2バイト以上預金口座、65535、大半の保存することができ
UTF-8を:それを維持するために可変長バイト、英語ASCIIがで占められています1バイト、中国語の3バイト。
エンコードエンコード
デコードデコード
デフォルトのUnicode上のPython 3
れるデータ型のバイトに符号化しながらエンコードを
同時にデコードコードするタイプバイトはれる文字列に変換
B =バイト型バイト= = [0-255]
#__Author: "hanhankeji" #1 DATE:2019年12月19日 インポート SYS 印刷(sys.getdefaultencoding()) #のビュー8デフォルトエンコーディングUTF。 S = " テスラ" 印刷(S) s_to_gbk = s.encode(" GBK " ) 印刷(s_to_gbk)
UTF-8 テスラの B '\ XCC \ xd8 \ XCB \ xb9 \ XC0 \ XAD'