python decode()和encode()

学习笔记:python decod()和encode()

初学python爬虫,遇到了网页的编码转换,对其中decode()方法不是十分的了解,从网上查阅相关的资料后了解到,encode()是对字符串进行转码的方法,decode()是对字符串进行解码的方法。从网上爬取的网页源码大多会设置页面的encoding为utf-8,所以从网页上爬取的网页要进行decode(‘UTF-8’)解码。

Python中str类型变量和bytes变量的区别

str字符串类型,它在Python中的默认编码是Unicode,即该字符串在电脑磁盘上存储时由Python自动进行解码和编码。bytes数据类型则是没有经过Python经过任何处理的二进制比特流,使用时需要程序员根据特定的需求对它进行编码和解码的操作。

Python中编码和解码的代码演示


使用字符串类型,Python自动完成编码和解码。
在这里插入图片描述
将上面的字符串进行编码后变成一个bytes类型的输出结果(字符串前面的b表示这是一个byte对象)。
在这里插入图片描述
利用bytes对象的decod()方法对其进行解码后有重新变成正常的str类型的字符串。

发布了10 篇原创文章 · 获赞 69 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/qq_38313674/article/details/89609736