学习笔记:python decod()和encode()
初学python爬虫,遇到了网页的编码转换,对其中decode()方法不是十分的了解,从网上查阅相关的资料后了解到,encode()是对字符串进行转码的方法,decode()是对字符串进行解码的方法。从网上爬取的网页源码大多会设置页面的encoding为utf-8,所以从网页上爬取的网页要进行decode(‘UTF-8’)解码。
Python中str类型变量和bytes变量的区别
str字符串类型,它在Python中的默认编码是Unicode,即该字符串在电脑磁盘上存储时由Python自动进行解码和编码。bytes数据类型则是没有经过Python经过任何处理的二进制比特流,使用时需要程序员根据特定的需求对它进行编码和解码的操作。
Python中编码和解码的代码演示
使用字符串类型,Python自动完成编码和解码。
将上面的字符串进行编码后变成一个bytes类型的输出结果(字符串前面的b表示这是一个byte对象)。
利用bytes对象的decod()方法对其进行解码后有重新变成正常的str类型的字符串。