简单粗暴的提取西刺IP和端口（附源码，爬虫小白，求勿喷） - 代码天地

简单粗暴的提取西刺IP和端口（附源码，爬虫小白，求勿喷）

其他 2018-07-17 21:02:56 阅读次数: 0

import urllib
import re
import time
from urllib import request
from urllib import parse
import chardet
proxy = {"http": "123.207.30.131:80"}
proxy_support = request.ProxyHandler(proxy)
opener = request.build_opener(proxy_support)
request.install_opener(opener)
url = "http://www.xicidaili.com/nn"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"}
patternIP = re.compile(r'(?<=<td>)[\d]{1,3}\.[\d]{1,3}\.[\d]{1,3}\.[\d]{1,3}')
patternPORT = re.compile(r'(?<=<td>)[\d]{2,5}(?=</td>)')
req = request.Request(url, headers=headers)
response = request.urlopen(req)
html = response.read()
findIP = re.findall(patternIP,str(html))
findPORT = re.findall(patternPORT,str(html))
charset = chardet.detect(html)['encoding']
IP_data =[]
for i in range(len(findIP)):
     findIP[i] = findIP[i] + ":" + findPORT[i]
     IP_data.extend(findIP)
print(charset)
print(IP_data)

猜你喜欢

转载自blog.csdn.net/lzz781699880/article/details/81072022

简单粗暴的提取西刺IP和端口（附源码，爬虫小白，求勿喷）

爬虫提取有道翻译（附源码，爬虫小白，求勿喷）

[python爬虫]爬虫西刺ip代理

爬取西刺代理的IP与端口（一）

python爬虫西刺代理ip爬取

西刺代理ip解析

Python学习笔记--Python 爬虫入门 -18-4 Scrapy案例2 ( 西刺代理IP)

爬虫--多线程爬取可以使用的西刺代理ip

爬虫小程序之爬取西刺免费高匿IP构建代理池

爬取西刺代理的免费IP

为反反爬虫，打造一个自己的IP池？Python获取西刺代理IP并验证！

python：多线程抓取西刺和快站高匿代理IP

代理IP爬取和验证（快代理&西刺代理）

Scrapy爬虫爬取西刺IP（适合scrapy初学者）--附带python3学习心得（一）

常见的协议汇总（小白个人理解，大佬勿喷）

验证西刺代理ip有效性

西刺代理（用老师ip）爬取

java爬取西刺ip代理练习

建立自己的IP代理池[爬取西刺代理]

Scrapy爬取西刺代理ip流程

python+scrapy 爬取西刺代理ip(一)

Python 爬取西刺可用代理IP，自带检测。

爬虫（三）：爬取西刺高匿代理

看源码技巧总结（持续更新，勿喷~）

矩阵相乘c++实现，简单大佬勿喷

简单说Linux，新手必看，不喜勿喷

西刺代理

【Java蓝桥杯】关于从小白到省二的经验分享和心得体会（本人学术浅淡，不喜勿喷）

（python2）从西刺代理获取代理IP，构建代理IP池

python扒取西刺代理ip并使用ip访问网址

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)