我们在爬取网页数据的时候,遇到json时候,而json会有多种格式。接下来我分享下json标准格式和非标准格式的获取方法。
一:标准的json
获取方法:直接使用result=json.loads(html.text),将str类型转为字典类型
二:非标准的json
此处可看出比标准json格式多了个括号,而括号里面是标准的json格式
获取方法:使用正则,提取我们所需的字段 如 html=html[1:][:-1] 就可以去除掉两边的括号
再用result=json.loads(html.text)