python解码(decode)的四个参数以及如何使用二进制码和字符之间的转换

有些字形无法在编辑器中显示,或是不想被人看到,可以直接使用二进制代码。

print("\u0394")
#要大写
print("\U00000394")
#使用名字
print("\N{greek capital letter delta}")

解码的四个参数,特别是出现乱码时很有必要应用这些参数

#码的四个参数
print((b"\x80abc").decode("utf-8","strict"))#出现错误
#加上(U+FFFD)
print((b"\x80abc").decode("utf-8","replace"))
#加反斜杠
print((b"\x80abc").decode("utf-8","backslashreplace"))
#直接忽略
print((b"\x80abc").decode("utf-8","ignore"))
 

运行结果是


字符和二进制之间的转换

#将数值转化为字符
u=chr(40960)+"abce"+chr(1972)
print(u)
u1=chr(123)
print(u1)
#将字符转化为二进制
u="中国abc"
print(u.encode("utf-8"))

#“中国”是:b'\xe4\xb8\xad\xe5\x9b\xbd'
#print(u.encode("ascii"))
print(u.encode("ascii","ignore"))
print(u.encode("ascii","replace"))
print(u.encode("ascii","xmlcharrefreplace"))
print(u.encode("ascii","backslashreplace"))
print(u.encode("ascii","namereplace"))

最后运行结果如下:

从“namereplace”中获取每个字符的名字也很有意思。 

猜你喜欢

转载自blog.csdn.net/acflair/article/details/82909329