python3（requests）使用代理ip - 代码天地

python3（requests）使用代理ip

其他 2018-11-12 22:10:57 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_40693171/article/details/83588989

当需要采集大量数据时，或者有的网站对访问速度特别严格的时候，有的网站就采取封ip，这样就需要使用代理ip。就像马蜂窝一样，，自从被曝数据造假之后，就不好爬了，python使用代理ip的小demo为：

import  requests
from bs4 import BeautifulSoup
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
proxies = {'http': '120.236.128.201:8060',
           'https': '120.236.128.201:8060'
           }
url="http://www.overlove.xin/html/"
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
req=requests.get(url,headers=header,proxies=proxies,timeout=5)
html=req.text
soup=BeautifulSoup(html,'lxml')
print(soup.text)

输出为：在这里插入图片描述
找一个可以定位的网站测试

网站是我以前写的一个天气预报接口（已经暴毙）。之前有写过用java如何写天气接口通过ip查看天气信息
如果通过购买的代理ip，就需要先解析格式，提取ip和端口构造ip池，进行随机选用。原谅我穷逼买不起ip。。呜呜。

另外，使用代理ip的时候一定要用好try catch，如果对信息完整性要求比较高。还需要对失败后从写方法，因为代理ip如果时免费的并不稳定，也有点慢。还有，有的ip不能用他会瞎跳到其他的链接上，比如跳到有道上，所以，使用代理ip时候一定要处理好异常，防止程序异常终止。

猜你喜欢

转载自blog.csdn.net/qq_40693171/article/details/83588989

python3（requests）使用代理ip

python3 requests 使用proxy代理

python3 requests IP代理池出错

【Python3】基于Requests库的爬虫代理ip的配置以及使用

Python3 爬虫使用代理 IP

Python3 【requests使用】

Python3 requests爬取代理IP并验证可用性

【Python3 爬虫】12_代理IP的使用

requests使用ip代理

requests使用代理ip

Python3获取代理IP

python3在线更新代理IP

python3学习-requests使用

python3: requests模块的使用；

python3简单使用requests

Python3爬虫requests使用

python3 requests

requests使用代理IP访问

Python3网络爬虫——（3）代理服务器设置（IP代理使用）

【python3】如何建立爬虫代理ip池

python3 Scrapy爬虫框架ip代理配置

python3之requests

Python3 Requests模块

python3 安装 requests

python3 requests详解

Python3使用Requests抓取网页乱码问题

Python3爬虫（四）请求库的使用requests

Python3使用requests模块显示下载进度

python3爬虫攻略（9）：requests的使用

python3 使用requests获取网页内容

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)