Python爬取斗图表情，让你成为斗图大佬 - 代码天地

Python爬取斗图表情，让你成为斗图大佬

其他 2019-01-04 15:24:04 阅读次数: 0

话不多说，上结果（只爬了10页内容）

上代码：（可直接运行）用到Xpath

#encoding:utf-8
# __author__ = 'donghao'
# __time__ = 2018/12/24 15:20
import requests
import urllib.request
import urllib3
import os
import re
import time
from lxml import etree


def parse_page(url):
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:57.0) Gecko/20100101 Firefox/57.0'
    }
    resp = requests.get(url=url,headers=headers)
    text = resp.text
    html = etree.HTML(text)
    imgs = html.xpath("//div[@class='page-content text-center']//img[@class!='gif']")
    for img in imgs:
        #获取图片url
        img_url = img.get('data-original')
        #获取图片Url的后缀名
        end = os.path.splitext(img_url)[1]
        #替换掉url中特殊字符
        end = re.sub(r'[，。?？,/\\·]','',end)
        # 获取图片描述,并加上后缀
        name = img.get('alt')+end
        #文件名为
        #下载到本地文件夹
        urllib.request.urlretrieve(img_url,'images/'+name)

def main():
    #爬取10页
    for x in range(1,10):
        url = 'http://www.doutula.com/photo/list/?page=%d'%x
        parse_page(url)


if __name__ == '__main__':
    start = time.time()
    main()
    end = time.time()
    print('耗时：%0.002fs' % (end - start))

猜你喜欢

转载自blog.csdn.net/qq_42239520/article/details/85234874

Python爬取斗图表情，让你成为斗图大佬

斗图斗不过小伙伴？python多线程爬取斗图网表情包，助你成为斗图帝！

想成为斗图帝吗？python教你爬取大量全套表情包（附源码）！

python 爬取表情包——斗图啦

斗图高手教你用Python批量爬取表情包

Python爬取斗图网站

Python 爬取斗图啦图片

【爬虫】Yhen手把手教你爬取表情包，让你成为斗图界最靓的仔！

斗图？教你用Python制作表情包

python爬取斗图网中的 “最新套图”和“最新表情”

爬取斗图网表情包之后斗图会输？不存在的

Python项目实战:爬取斗图网表情包图片

【Python3 爬虫】U28_多线程爬取斗图啦的表情包

Python 爬取表情包-斗图不会输在起跑线

python爬虫：爬取斗图啦数据

Python-爬取斗图啦网站

Python多线程爬虫教你如何快速下载表情包，告别斗图斗不赢的烦恼！

Python爬虫入门教程 13-100 斗图啦表情包多线程爬取

Python爬虫入门教程第十三讲：斗图啦表情包多线程爬取

学好Python轻松成为斗图大师！

shell爬取斗图网

多线程爬取斗图图片

爬取斗图网的图片

scrapy-爬取斗图

多线程爬取斗图啦

爬取表情包-1分钟爬取1000多张图，斗图不在怕-（原创）

多线程爬取表情包，斗图再也难不倒我了

spider_爬取斗图啦所有表情包（图片保存）

真香警告！多线程分类表情包爬取，一起斗图叭(*^▽^*)~~~

python爬取图

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)