爬取mzi图片 - 代码天地

爬取mzi图片

其他 2018-09-01 11:50:29 阅读次数: 0

import requests
import mysqlhelper
from lxml import etree
import os
import re
from urllib import request

base_url='http://www.mzitu.com/page/%s/'
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36',
    # 'Cookie':'Hm_lvt_dbc355aef238b6c32b43eacbbf161c3c=1534495457; Hm_lpvt_dbc355aef238b6c32b43eacbbf161c3c=1534507556',
    # 'Host':'http://www.mzitu.com/',
    'Referer':'http://www.mzitu.com/page/2/',

}
if not os.path.exists('download'):
    os.mkdir('download')
for i in range(1,4):
    url=base_url % i
    # print(url)
    response= requests.get(url,headers=headers)
    # print(response.text)
    res_html=response.text
    pattern =r'<li>.*<img.*data-original=\'(.*?)\' />'
    # pattern_alt=r'<li>.*<span>.*<a.*>(.*?)</a>'
    # res_alt=re.findall(pattern_alt,res_html)
    # for alt in res_alt:
    #     name = alt + '.jpg'
    res_src=re.findall(pattern,res_html)
    for imgs_src in res_src:
        print(imgs_src)
        name=imgs_src.split('/')[-1]
        filename = 'download/'+name
        # request.urlretrieve(imgs_src,filename)
        #此处img_src为图片的地址与上面url不同
        response = requests.get(imgs_src,headers=headers)
        with open(filename,'wb')as f:
            f.write(response.content)

猜你喜欢

转载自blog.csdn.net/weixin_42958164/article/details/81783616

爬取mzi图片

scrapy爬取图片

scrapy 爬取图片

图片爬取与下载

爬取图片

webmagic爬取图片

爬取斗鱼图片

爬取妹子图片

爬取图片 jsoup

Python爬取图片

爬取网上的图片

jsoup爬取图片

爬取360图片

实现爬取图片

批量爬取图片

害虫图片爬取

爬取网页图片

socket爬取图片

Alex -爬取图片

苹果图片爬取

图片爬取

图片爬取实战

urllib爬取图片

python爬取图片简记

scrapy(3)爬取图片

Python爬取淘宝图片

Phantomjs与Selenium爬取图片

Python爬取网页图片

爬取贴吧图片

Scrapy爬取图片教程

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)