Python爬取美桌网图片（保存在电脑上） - 代码天地

Python爬取美桌网图片（保存在电脑上）

其他 2021-02-27 22:26:05 阅读次数: 0

之前看视频写的，做个记录上传一下把！
用python爬取图片，用到的模块有requests和parsel
附上代码

import parsel
import requests
#一共五页
for page in range(1,6):
    print("正在爬取第{}页数据".format(page))
    #爬虫的一般思路
    # 分析目标网页，确定爬取的url路径，headers参数
    base_url = "http://www.win4000.com/meinvtag26_{}.html".format(str(page))
    headers = {
    
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3775.400 QQBrowser/10.6.4208.400"}
    # 发送请求-- requests模拟浏览器发送请求，获取响应数据
    response = requests.get(url = base_url,headers = headers)
    data = response.text
    # print(data)
    # 解析数据 --parsel 转化为Selector对象 Selector对象具有xpath方法，能够对转化的数据进行处理
    html_data = parsel.Selector(data)
    # extract()返回的是一个列表
    data_list = html_data.xpath("//div[@class='Left_bar']//ul/li/a/@href").extract()
    # print(data_list)
    for alist in data_list:
        response_2 = requests.get(url=alist,headers = headers).text
        # 解析相册内部的url地址
        response_2_data = parsel.Selector(response_2)
        img_url = response_2_data.xpath("//div[@class='pic-meinv']/a/img/@data-original").extract_first()
        print(img_url)
        img_data = requests.get(url=img_url,headers = headers).content
        # 保存数据
        # 准备文件名称
        file_name = img_url.split("/")[-1]
        with open("file_name\\" +file_name,mode='wb') as f:
            print("正在保存图片：",file_name)
            f.write(img_data)

猜你喜欢

转载自blog.csdn.net/m0_50481455/article/details/108872858

Python爬取美桌网图片（保存在电脑上）

Python爬取美桌网美女图片

python-scapy爬取mooc网保存在数据库中并下载图片

Python爬取美空网未登录图片

pycharm中python爬取知网论文信息并保存在Excel中（1）

【python爬虫自学笔记】-----爬取知乎图片并保存在本地

python批量爬取图片并保存在本地文件夹下

爬虫：爬取图片并保存在某路径下

使用Scrapy爬取图片入库,并保存在本地

python爬取美空网女神图片，小心内存走火

Python爬虫入门教程 4-100 美空网未登录图片爬取

Python爬虫入门教程：美空网未登录图片爬取

Python爬虫入门【4】：美空网未登录图片爬取

Python保存爬虫爬取的图片

Python爬虫自动爬取图片并保存

Python：scrapy框架爬取校花网男神图片保存到本地

Python 爬取图虫网图片

python爬取校花网的图片

Python 爬虫爬取煎蛋网图片

Python爬取煎蛋网图片

python爬取花瓣网图片

python 爬取虎嗅网(上）

Python爬取知乎上的图片

Python爬虫---爬取网络上的图片

Python爬虫入门【3】：美空网数据爬取

python爬虫练习爬取美团网酒店信息

Python爬虫教程——美空网未登录图片爬取！这个网站这么多小姐姐

python——爬取图片（shutter图片网）

python爬取数据保存为图片

python爬虫爬取图片并保存到本地

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)