Python爬虫中json数据的处理

我们在爬取网页数据的时候,遇到json时候,而json会有多种格式。接下来我分享下json标准格式和非标准格式的获取方法。

一:标准的json


获取方法:直接使用result=json.loads(html.text),将str类型转为字典类型

二:非标准的json


此处可看出比标准json格式多了个括号,而括号里面是标准的json格式

获取方法:使用正则,提取我们所需的字段  如 html=html[1:][:-1]  就可以去除掉两边的括号

再用result=json.loads(html.text)

猜你喜欢

转载自blog.csdn.net/Gaodes/article/details/80793170