python爬虫学习（十三）xpath爬取妹子图片 - 代码天地

python爬虫学习（十三）xpath爬取妹子图片

其他 2020-03-26 15:02:32 阅读次数: 0

# -*- coding: utf-8 -*-
import requests
from lxml import etree
import os
if __name__ == '__main__':
    #爬取页面源码数据
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'
    }
    url='http://pic.netbian.com/4kmeinv/'
    response=requests.get(url=url,headers=headers)
    # #手动改变响应数据为utf-8
    # response.encoding = 'utf-8'
    page_text = response.text

    #数据解析：src的属性值 alt属性值
    tree = etree.HTML(page_text)
    li_list = tree.xpath('//div[@class="slist"]/ul/li')

    #创建一个文件夹
    if not os.path.exists('./piclibs'):
        os.mkdir('./piclibs')

    for li in li_list:
        img_src = 'http://pic.netbian.com'+li.xpath('./a/img/@src')[0]
        img_name = li.xpath('./a/img/@alt')[0]+'.jpg'
        #转码,处理乱码
        img_name = img_name.encode('iso-8859-1').decode('gbk')
        #print(img_name,img_src)
        #请求图片做存储
        img_data =requests.get(url=img_src,headers=headers).content
        img_path = 'piclibs/'+img_name
        with open(img_path,'wb') as fp:
            fp.write(img_data)
            print(img_name,'下载成功')
    print("操作完成")

发布了23 篇原创文章 · 获赞 0 · 访问量 668

私信关注

猜你喜欢

转载自blog.csdn.net/haimian_baba/article/details/103816206

python爬虫学习（十三）xpath爬取妹子图片

python爬虫学习（七）爬取单张妹子图片

Python爬虫之——爬取妹子图片

Python爬取妹子图片

python爬虫学习（八）正则表达式批量爬取妹子图片

爬虫小案例爬取（妹子图片）

python爬虫学习（九）妹子图分页爬取

python爬虫--xpath结合re同时爬取文字与图片

python爬虫--re结合xpath爬取图片

【Python学习之旅】---爬虫（xpath表达式，爬取网络段子和贴吧图片）

python xpath图片爬取

[python爬虫]爬取妹子图

Python爬虫教程：爬取妹子图

python爬虫——爬取妹子图

python-python爬取妹子图片

python爬取淘宝漂亮的妹子图片

爬取妹子图片

python爬虫篇1：爬妹子图片

用爬虫爬取某妹子图片网站图片

Python爬虫实战(4)-带你用Python爬取妹子图片

Python爬虫之使用xpath开启多线程和协程配合使用爬取妹子图，批量下载

Python爬虫-爬取扇贝单词(Xpath)

爬虫学习：xpath爬取评书网

Python爬虫福利第二弹---爬取妹子图最新图片

.Net Core爬虫爬取妹子网图片

Python3 Scrapy框架学习三：爬取煎蛋网加密妹子图片(全爬)

python爬虫－爬取图片

python爬虫爬取图片

Python爬虫：爬取图片

python爬虫 - 爬取图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)