python爬图准备多线程 - 代码天地

python爬图准备多线程

其他 2019-05-06 20:14:45 阅读次数: 0

#codeing = utf-8
#官方3.0版本已经把urllib2,urlparse等五个模块都并入了urllib中
import urllib.request
import re

def getHtml(url):
    #打开连接
    page = urllib.request.urlopen(url)
    #获取网页内容
    html = page.read()
    print(html)
    return html

def getImg(html):
    #正则表达式
    reg = r'src="(.+?\.jpg)" alt='
    imgre = re.compile(reg)
    #以列表的形式返回能匹配的子串
    imgList = re.findall(imgre,html.decode('utf-8'))
    x=0
    for imgurl in imgList:
        #把爬取到的资源保存到本地
        urllib.request.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1
    return imgList
#输入你想要爬取的网站
#url='https://www.113yq.com/pic/html28/index_3.html'
html=getHtml(new_url)
#html=getHtml("http://pic.yxdown.com/list/0_0_1.html")
print(getImg(html))

--------------------- 
作者：热心市民大G 
来源：CSDN 
原文：https://blog.csdn.net/tyt_xiaotao/article/details/80209398 
版权声明：本文为博主原创文章，转载请附上博文链接！

猜你喜欢

转载自www.cnblogs.com/xiaohe520/p/10821679.html

python爬图准备多线程

多线程爬取妹子图 python 爬虫

Python爬虫教程：图虫网多线程爬取

Python3多线程爬取妹子图的图片

Python 多线程实现爬取妹子图

Python-爬取妹子图(单线程和多线程版本)

多线程爬取斗图图片

多线程爬取斗图啦

Python Requests多线程爬取数据清洗彼岸图网缩略图demo

Python爬虫入门教程 10-100 图虫网多线程爬取

Python爬虫入门教程 10-100 图虫网多线程爬取！

Python爬虫入门教程第十讲：图虫网多线程爬取

Python爬虫之多线程图虫网数据爬取（十六）

【Python3 爬虫】U28_多线程爬取斗图啦的表情包

python多线程爬取网页

python多线程并行爬取

python多线程爬取图片实例

python多线程爬取图片二

Python多线程爬取小说

python中的多进程与多线程　提升keras训练时数据准备的速度

面试准备--多线程

面试准备——多线程

多线程爬

多线程爬虫爬取妹子图网站

斗图斗不过小伙伴？python多线程爬取斗图网表情包，助你成为斗图帝！

Python爬虫之使用xpath开启多线程和协程配合使用爬取妹子图，批量下载

Python爬虫入门教程 13-100 斗图啦表情包多线程爬取

Python爬虫入门教程第十三讲：斗图啦表情包多线程爬取

【Python3爬虫-爬图片】多线程爬取中国国家地理全站美图，多图可以提高你的审美哦

多线程思路图

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

慧测学习课件

Mscordacwks.dll/SOS.dll 调试归档

关于深度学习人工智能模型的探讨（二）（7）

Stop Using the text-indent:-9999px

Least Common Multiple（HDU - 1019 ）

Comparator接口的使用方法--例子

修改framework Camera的API,旋转摄像头

机器学习时代的“大数据+”：数据平台的设计与搭建

vue 项目部署到nginx

webstorm 常用插件集合

每日归档

更多

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)