有些字形无法在编辑器中显示,或是不想被人看到,可以直接使用二进制代码。
print("\u0394")
#要大写
print("\U00000394")
#使用名字
print("\N{greek capital letter delta}")
解码的四个参数,特别是出现乱码时很有必要应用这些参数
#码的四个参数
print((b"\x80abc").decode("utf-8","strict"))#出现错误
#加上(U+FFFD)
print((b"\x80abc").decode("utf-8","replace"))
#加反斜杠
print((b"\x80abc").decode("utf-8","backslashreplace"))
#直接忽略
print((b"\x80abc").decode("utf-8","ignore"))
运行结果是
字符和二进制之间的转换
#将数值转化为字符
u=chr(40960)+"abce"+chr(1972)
print(u)
u1=chr(123)
print(u1)
#将字符转化为二进制
u="中国abc"
print(u.encode("utf-8"))
#“中国”是:b'\xe4\xb8\xad\xe5\x9b\xbd'
#print(u.encode("ascii"))
print(u.encode("ascii","ignore"))
print(u.encode("ascii","replace"))
print(u.encode("ascii","xmlcharrefreplace"))
print(u.encode("ascii","backslashreplace"))
print(u.encode("ascii","namereplace"))
最后运行结果如下:
从“namereplace”中获取每个字符的名字也很有意思。