python10行代码，让你成功伪装逃过反爬虫程序 - 代码天地

python10行代码，让你成功伪装逃过反爬虫程序

编程语言 2019-10-22 04:10:15 阅读次数: 0

本篇文章主要介绍了python网络爬虫之如何伪装逃过反爬虫程序的方法，小编觉得挺不错的，现在分享给大家，也给大家做个参考。

python10行代码，让你成功伪装逃过反爬虫程序

有的时候，我们本来写得好好的爬虫代码，之前还运行得Ok, 一下子突然报错了。

报错信息如下：

Http 800 Internal internet error

这是因为你的对象网站设置了反爬虫程序，如果用现有的爬虫代码，会被拒绝。

之前正常的爬虫代码如下：

1 from urllib.request import urlopen
2 ...
3 html = urlopen(scrapeUrl)
4 bsObj = BeautifulSoup(html.read(), "html.parser")

这个时候，需要我们给我们的爬虫代码做下伪装，

给它添加表头伪装成是来自浏览器的请求

修改后的代码如下：


在学习过程中有什么不懂得可以加我的
python学习交流扣扣qun，×××
群里有不错的学习视频教程、开发工具与电子书籍。
与你分享python企业当下人才需求及怎么从零基础学习好python，和学习什么内容
1 import urllib.parse
2 import urllib.request
3 from bs4 import BeautifulSoup
4 ...
5 req = urllib.request.Request(scrapeUrl)
6 req.add_header('User-Agent', 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)')
7 response = urllib.request.urlopen(req)
8 html = response.read()
9 
10 bsObj = BeautifulSoup(html, "html.parser")

Ok,一切搞定，又可以继续爬了。

以上就是本文的全部内容，觉得文章还不错的话不妨收藏起来慢慢看，有任何建议或看法欢迎大家在评论区分享讨论！

猜你喜欢

转载自blog.51cto.com/14568144/2444295

python10行代码，让你成功伪装逃过反爬虫程序

python网络爬虫之如何伪装逃过反爬虫程序的方法

《封号码罗》python爬虫之30行代码破解图片伪装反爬虫（一）

Python10行代码实现目标检测

《封号码罗》python爬虫之10行代码破解网页动态反爬虫（二）

python爬虫——爬虫伪装和反“反爬”

Python10行以内代码能有什么高端操作

Python10行以内代码能有什么高端操作？| 原力计划

python基于scrapy框架的网络爬虫程序反爬虫机制之User-Agent伪装

python10

目标检测很难？Python10行代码就能写出来，而且还非常好用

Python10个tips让你开发更高效

Python 从零开始爬虫(一)：爬虫伪装&反“反爬”

Python爬虫自学之第（①）篇——爬虫伪装和反“反爬”

Python10：高级特性

《封号码罗》python爬虫之70行代码破解CSS映射SVG反爬虫（四）

《封号码罗》python爬虫之60行代码破解CSS偏移反爬虫（三）

【资料】学习笔记Python10行内的高端操作

python 爬虫伪装

不止是图片伪装反爬虫

Python10（第一个程序03—Hello Python程序演练）

Python爬虫（一）：爬虫伪装

Python 爬虫（一）：爬虫伪装

Python爬虫技术：爬虫时如何知道是否代理ip伪装成功？

Python爬虫——爬虫时如何知道是否代理ip伪装成功？

python10大排序

函数知识点---Python10

Python10大热门项目

python10 函数式编程

python10 项目目录结构

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)