【2018.12.14】python3.7 一个低级趣味的爬虫（requests+pyquery）妹纸的图哇咔咔 - 代码天地

【2018.12.14】python3.7 一个低级趣味的爬虫（requests+pyquery）妹纸的图哇咔咔

其他 2018-12-24 11:01:08 阅读次数: 0

这是个低级趣味的爬虫

#!/practice/Study_Test python
# -*- coding: utf-8 -*-
# @Time    : 2018/12/13 23:35
# @Author  : yb.w
# @File    : 18_12_12_Sister.py
import os
import requests
from pyquery import PyQuery as pq
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',
}

def get_requests(url):
    html = requests.get(url=url,headers=headers).content.decode("utf-8")
    doc = pq(html)
    items = doc('.span3').items()

    for each in items:
        # 向下查找 追加一个属性
        url_img = each.find("img").attr("src")
        name = each.find("img").attr("title")
        #再次请求网络 获取图像内容
        download_img = requests.get(url_img,headers=headers).content
        print('图片名字: %s 图片链接：%s'%(name,url_img))
        try:
            with open('./12_12_妹纸图/'+name+'.jpg','wb') as f:
                f.write(download_img)
        except OSError:
            continue


if __name__ == '__main__':
    file_path = os.path.join(os.getcwd(),'12_12_妹纸图')
    #判断路径是否存在
    if not os.path.exists(file_path):
        #不存在就创建这个文件夹
        os.makedirs(file_path)
    for item in range(1,15):
        url = "https://www.dbmeinv.com/?pager_offset=%s"%str(item)
        get_requests(url)

猜你喜欢

转载自blog.csdn.net/qq_38534107/article/details/85006553

【2018.12.14】python3.7 一个低级趣味的爬虫（requests+pyquery）妹纸的图哇咔咔

python3.7简单的爬虫

（一）Python3.7 安装

（一）python3.7的安装

python3.7入门系列一 Win7下安装python3.7

Python爬虫笔记——python3.7安装Scrapy

在Windows下安装Python3.7中的requests模块

Python3.7离线安装Requests无法正常使用问题

爬虫之Macbook Python3.7 安装 PySpider各种坑

Python3.7之100个实例（未完）

【Python3.7学习笔记】一、环境搭建

opencv使用（一）：安装 -- 基于python3.7

linux 一行命令安装python3.7

Python3.7之抽象类与归一化

【Python3.7学习笔记】二、第一个python程序

基于centos7,python3.7新建第一个Django项目

Python3.7编写一个入侵的病毒！（纯属基友恶搞）

快速入门（完整）：Python实例100个（基于最新Python3.7版本）

在Windows下安装Python3.7中的requests模块（教你跳坑）

Python3.7离线安装Requests无法正常使用问题（转载）

python3.7爬虫实战系列爬取掘金网首页存入mysql数据库

Python3.7 爬虫介绍---urllib 实现下载网页的三种方式

基于Python3.7的百度百科爬虫

python3.7爬虫:使用Selenium带Cookie登录并且模拟进行表单上传文件

windows下的Python3.7：关于使用select进行套接字读写的一些疑问。

Python3.7和数据库MySQL交互(一)MYsql 安装教程

python3.7 打包成exe的一种方法 pyinstaller

Python3.7的tkinter说明书！还送你一套本地登录软件！

零基础入门python3.7 ——基础知识总结（一）开篇

记一次python3.7环境安装dlib模块遇到的坑

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)