《爬虫》爬取可用的免费IP - 代码天地

《爬虫》爬取可用的免费IP

其他 2020-04-08 15:17:36 阅读次数: 0

import telnetlib
import urllib.request
from bs4 import BeautifulSoup

for d in range(1, 3):  # 采集1到2页
	scrapeUrl = 'http://www.xicidaili.com/nn/%d/' % d
	req = urllib.request.Request(scrapeUrl)
	req.add_header('User-Agent', 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)')
	response = urllib.request.urlopen(req)
	html = response.read()

	bsObj = BeautifulSoup(html, "html.parser")

	for i in range(100):
		speed = float(bsObj.select('td')[6 + i * 10].div.get('title').replace('秒', ''))
		if speed < 0.2:  # 验证速度，只要速度在0.2秒之内的
			ip = bsObj.select('td')[1 + i * 10].get_text()
			port = bsObj.select('td')[2 + i * 10].get_text()
			ip_address = 'http://' + ip + ':' + port
			try:
				telnetlib.Telnet(ip, port=port, timeout=2)  # 用telnet对ip进行验证
			except:
				print('fail')
			else:
				print('sucess：' + ip_address)
				f = open('proxy_list.txt', 'a')
				f.write(ip_address + '\n')
				f.close()

　　

猜你喜欢

转载自www.cnblogs.com/shuimohei/p/12660070.html

《爬虫》爬取可用的免费IP

Python爬虫：爬取免费代理ip

爬虫爬取可用的免費代理IP

PYTHON爬虫代理如何设置？用免费IP或IP池和REQUEST库爬取网页

【python3爬虫系列】问题一：去西刺爬取免费可用的代理（用requests爬取）

PHP简单爬虫爬取免费代理ip 一万条

爬虫小程序之爬取西刺免费高匿IP构建代理池

爬虫代理设置--爬取ip池、验证ip是否可用、验证代理ip是否能用

scrapy爬取可用的代理ip

Python实现爬取可用代理IP

测试爬取IP是否可用代码

爬取免费代理IP代码

爬取西刺代理的免费IP

golang爬取免费代理IP

爬取快代理的免费IP并测试

爬取免费代理IP并测试

【python爬虫】爬取ip代理池

Python练习三:爬虫练习,从一个提供免费代理的网站中爬取IP地址信息

Python 爬取西刺可用代理IP，自带检测。

《分享项目_python爬取可用代理ip》

python爬取免费优质IP归属地查询接口

爬取免费代理上网/组建IP代理池

java初试爬虫jsoup爬取纵横小说免费模块

极简代理IP爬取代码——Python爬取免费代理IP

python爬虫十二：爬取快速ip代理，攻破503

C#攻克反爬虫之代理IP爬取

python爬虫西刺代理ip爬取

爬虫篇——代理IP爬取备用及存储

如何用爬虫代理ip爬取商品价格？

Python使用爬虫ip爬取动态网页

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)