爬虫爬取表情 - 代码天地

爬虫爬取表情

其他 2018-11-16 13:52:26 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhao_5352269/article/details/83418837

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2018/10/26 15:27
# @Author  : jia.zhao
# @Desc    : 
# @File    : doutu_request.py
# @Software: PyCharm

from selenium import webdriver
import time
import urllib.request


browser = webdriver.Chrome()
# img_url_dic = {}
for i in range(1, 100):
    browser.get('https://www.doutula.com/photo/list/?page=%s' % str(i))
    time.sleep(4)
    eles = browser.find_elements_by_xpath('//div[@class="container_"]/div[@id="pic-detail"]/div[@class="row"]/div[@class="col-sm-9"]/div[@class="random_picture"]/ul[@class="list-group"]/li[@class="list-group-item"]/div[@class="page-content text-center"]/div/a[@class="col-xs-6 col-sm-3"]/img[@data-original]')
    names = browser.find_elements_by_xpath('//div[@class="container_"]/div[@id="pic-detail"]/div[@class="row"]/div[@class="col-sm-9"]/div[@class="random_picture"]/ul[@class="list-group"]/li[@class="list-group-item"]/div[@class="page-content text-center"]/div/a[@class="col-xs-6 col-sm-3"]/img[@data-original]')

    for j in range(len(eles)):
        url = eles[j].get_attribute('data-original')
        name = names[j].get_attribute('alt')
        # if url != None and not url :

            # img_url_dic[url] = ''
        url = url.split('!')[0]
        ext = url.split('.')[-1]
        filename = name + '.' + ext
        # 保存图片数据
        data = urllib.request.urlopen(url).read()
        f = open('image/' + filename, 'wb')
        f.write(data)
        f.close()
        # print(browser.page_source)
    time.sleep(5)

browser.close()
browser.quit()

猜你喜欢

转载自blog.csdn.net/zhao_5352269/article/details/83418837

爬虫爬取表情

Python 网络爬虫---爬取表情包

【爬虫】多线程爬取表情包

网络爬虫-爬取十万张表情包

python爬虫教程：《利用Python爬取表情包》

Python爬虫使用requests库爬取表情包

爬取表情包

爬取动漫表情包

Python爬取表情包

【Python3 爬虫】U28_多线程爬取斗图啦的表情包

表情包不够用了吗？快来用爬虫爬取一波吧

【python】分享一个多线程爬虫爬取表情包的代码

爬虫爬取图库

爬虫断点爬取

爬虫----爬取答案

Python爬取网站gif表情包

python入门爬取表情包

python爬取表情包图片

Python爬虫入门教程 13-100 斗图啦表情包多线程爬取

Python爬虫入门教程第十三讲：斗图啦表情包多线程爬取

Python 爬虫爬取网页

[爬虫] 爬取POI服务

python爬虫－爬取图片

爬虫--爬取网站链接

python 爬虫爬取csdn

python爬虫爬取图片

Nodejs爬虫（定时爬取）

爬虫爬取股票信息

爬虫：Instagram信息爬取

爬虫爬取QQ号

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)