Python 批量爬取美女图片 - 代码天地

Python 批量爬取美女图片

其他 2020-04-07 18:34:13 阅读次数: 0

爬取妹子图目标网址：http://jandan.net/ooxx

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
import os
from concurrent.futures import ThreadPoolExecutor
from bs4 import BeautifulSoup


class MeiZi:
    def __init__(self):
        self.url = 'http://jandan.net/ooxx'
        self.path = os.path.join(os.getcwd(), 'img')
        self.count = 1
        self.pool = ThreadPoolExecutor(20)
        self.headers = {
            'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"
        }

    def img_dir(self):
        '''存放目录处理'''
        if not os.path.isdir(self.path):
            os.makedirs(self.path)

    def download(self, url, path):
        '''下载'''
        by_data = requests.get(url=url, headers=self.headers).content
        with open(path, 'wb') as f1:
            f1.write(by_data)
        print('%s 成功' % path)

    def a_link(self, a_list):
        '''处理图片url'''
        for li in a_list:
            url = 'http:' + str(li['href'])
            path = os.path.join(self.path, "%s.jpg" % self.count)
            self.pool.submit(self.download, url, path)
            self.count += 1

    def run(self):
        self.img_dir()
        response = requests.get(url=self.url, headers=self.headers).text
        soup = BeautifulSoup(response, 'lxml')
        page = soup.find('a', class_="previous-comment-page")
        a_list = soup.select(".commentlist > li > div > div > div > p > a")
        self.a_link(a_list)
        if page:
            url = 'http:' + str(page.attrs['href'])
            self.url = url
            self.run()
        else:
            return None


if __name__ == '__main__':
    M = MeiZi()
    M.run()

猜你喜欢

转载自www.cnblogs.com/HByang/p/12655060.html

Python 批量爬取美女图片

用python爬取美女图片

python爬虫-爬取美女图片

python爬取美女图片

Python爬虫爬取贴吧美女图片批量下载成功了

python爬虫之美女图片爬取

Python2爬取美女图片(mzitu)

python协程爬取直播美女图片

Python爬取美桌网美女图片

宅男福利用Python爬取美女图片

用python爬取海量美女图片

Python瀑布流爬虫-爬取360美女图片+爬取百度美女图片（嘿嘿~）

爬取篇-利用python3爬取美女图片

python批量下载美女图片

python批量抓取美女图片

python3.7--爬取上万张妹子图-------美女图片--玉米都督

聪哥哥教你学Python之如何爬取美女图片

Python爬虫实战——爬取今日头条美女图片

python协程gevent案例：爬取斗鱼美女图片

python爬虫一键爬取美女图片（梅开三度）

python一键爬取美女图片（梅开二度）

Python3 使用xpath匹配爬取彼岸壁纸高清美女图片

python学习之爬取煎蛋网美女图

Python爬取mn52网站美女图片以及图片防盗链的解决方法

Python爬虫学习之爬美女图片

Python爬虫实战批量下载高清美女图片

python2.7 用urllib2 etree xpath第三方模块爬取美女图片

python—多协程爬取斗鱼高颜值美女图片-2.0版本

美女图片爬取

爬取美女图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)