爬虫（9）：使用处理器Handler - 代码天地

爬虫（9）：使用处理器Handler

其他 2018-07-24 00:28:47 阅读次数: 0

response = urllib.request.urlopen(req)

urlopen缺点：不能添加IP池（不能使用代理IP）；不能使用cookie

所以要重写urlopen，自定义处理器HTTPSHandler:

import urllib.request

# 处理器（处理https，也能处理http协议）
handler = urllib.request.HTTPSHandler()

# 打开器
opener = urllib.request.build_opener(handler)

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}

url = 'http://www.baidu.com'
# 添加请求
req = urllib.request.Request(url, headers=headers)

"""
通过打开器打开网页方式
open的参数：fullurl, data=None, timeout
"""
# response = opener.open(req)
# print(response.read().decode('utf-8'))


"""
以下是安装全局打开器来打开网页方式
return opener.open(url, data, timeout):
用response = urllib.request.urlopen(req)打开网页，本质还是response = opener.open(req)
"""
# 安装全局打开器
urllib.request.install_opener(opener)
# 打开网页
response = urllib.request.urlopen(req)
print(response.read().decode('utf-8'))

猜你喜欢

转载自blog.csdn.net/yx1179109710/article/details/80901012

爬虫（9）：使用处理器Handler

爬虫---Handler处理器和自定义opener

爬虫day03 request模块， Handler处理器

应用处理器AP概述

使用处理器API的Kafka流有状态摄取

爬虫（GET）——handler处理器和自定义opener

网络爬虫 Handler处理器和自定义Opener,URLError和HTTPError

Python3 --- 爬虫之Handler处理器和自定义Opener

爬虫（8）：Handler处理器和自定义Opener

爬虫原理与数据抓取-----Handler处理器和自定义Opener

Python爬虫入门之五Handler处理器和自定义Opener

爬虫urllib2中Handler处理器和自定义Opener

爬虫之Handler处理器和自定义Opener

URL协议处理器Handler

LayaAir 事件处理器 Handler

android 当前设备可用处理器核心数

音频应用处理器性能benchmark

Bean后处理器的用处，由shiro配置想到的

读论文——专用处理器比较分析

基带处理器和应用处理器的核间通信

mybatis-封装工具类SqlSessionUtil，使用动态代理封装事务调用处理器

Python网络爬虫笔记（9）ProxyHandler处理器（代理设置）

Mina-Transports(传输协议)、处理器Handler

Handler处理器和自定义Opener

springmvc中非注解处理器Handler的开发

urllib.request中Handler处理器

netty发送和接收数据handler处理器

SpringMVC框架|Handler处理器的三种写法

Mybatis 自定义LocalDateTime类型处理器handler

ProxyHandler处理器（爬虫代理IP）

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

理解指针，*p,p=&c

LeetCode 90. 子集 II JavaScript实现

给IT人的15点建议：苦逼程序员的辛酸反省与总结

2019/09/05

通过优化App来适应网络（WWDC 2018 session 719）

网络通信协议自动转换之thrift到http

在vue中使用swiper4.x

java优化-java代码性能优化学习总结

python中类的函数中的self

面试-基础篇

每日归档

更多

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)

2024-04-06(65)