Python爬虫总结——常见的报错、问题及解决方案 - 代码天地

Python爬虫总结——常见的报错、问题及解决方案

其他 2019-12-25 11:01:27 阅读次数: 0

在爬虫开发时，我们时常会遇到各种BUG各种问题，下面是我初步汇总的一些报错和解决方案。
在以后的学习中，如果遇到其他问题，我也会在这里进行更新。
各位如有什么补充，欢迎评论区留言~~~

问题：

IP被封，或者因访问频率太高被拦截？？？

解决方案之一：

使用代理IP即可。

问题：

正确使用XPath之后并没有输出？？？

解决方案之一：

XPath只能提取未注释的代码，改用正则表达式即可。

问题：

容易被反爬搞死？？？

解决方案之一：

headers中都要带上User-Agent，而Cookie能不带则不带。

报错：

在这里插入图片描述
UTF-8不能处理字节？？？

解决方案之一：

在headers中加入Cookie即可输出正常的HTML。

报错：

在这里插入图片描述
‘ gbk ’不能处理‘ \xa0 ’ ？？？

解决方案之一：

with open('%s.html' % title, 'w', encoding='utf-8') as f:
    f.write(rep)

问题：

在这里插入图片描述
输出结果是字节类型，json对象无法正常显示？？？

解决方案之一：

使用json.loads方法即可。

问题：

url = 'https://tieba.baidu.com/f?kw=%E8%8B%B1%E9%9B%84%E8%81%94%E7%9B%9F&ie=utf-8&pn=0'

网址复制到py文件中，却变成了“乱码”？？？

解决方案之一：

调用urllib.parse.unquote进行URL解码即可。

问题：

在这里插入图片描述
URL地址不规范？？？

解决方案之一：

分析URL时，我们一般从第二页开始分析，而不是第一页。

问题：

不想Cookie中携带自身账号内容？？？

解决方案之一：

利用浏览器的无痕窗口功能，进入网页再取Cookie即可。

报错：

解决方案之一：

报错：

解决方案之一：

未完待续哦~~~~

为我心爱的女孩~~

猜你喜欢

转载自www.cnblogs.com/WoLykos/p/12095277.html

Python爬虫总结——常见的报错、问题及解决方案

常见的python报错及解决方案

Python常见报错与解决方案

Python常见报错及解决方案，建议收藏！

python常见报错以及解决方案梳理

Python常见报错及其解决方案

Storm常见问题及解决方案总结

常见报错及解决方案

Python中的常见问题与解决方案

Python网络编程：常见问题与解决方案

Lint常见的问题及解决方案

常见WinDbg问题及解决方案

常见Windows问题及解决方案

入坑爬虫之常见问题及解决方案

使用亿牛云爬虫代理常见问题的解决方案

scrapy爬虫学习系列七：scrapy常见问题解决方案

Python爬虫常见问题总结

maven项目常见报错问题集锦及解决方案

Linux——ssh远程连接常见报错问题及解决方案

C/C++常见报错问题描述及解决方案

Python常见第三方库在Windows安装报错解决方案

Tensorflow-常见报错解决方案

mysql 启动常见报错解决方案

Appium_4_常见报错&解决方案

Pytorch中常见的报错解决方案

iOS编译时常见报错解决方案

Git常见报错及解决方案

MySQL常见报错及解决方案

Appium常见报错&解决方案

Kibana启动常见报错信息的解决方案

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)