我觉得我写的爬图片的代码看着很舒服 - 代码天地

我觉得我写的爬图片的代码看着很舒服

其他 2018-05-30 13:17:18 阅读次数: 1

闲着也是闲着：
目标网站：http://image.so.com
代码：

# _*_ coding:utf-8 _*_

import os
import requests
from time import sleep
from urllib.parse import urlencode

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36',
    'Referer': 'https://image.so.com/z?ch=beauty',
    # 指从哪个网址跳转过来的，一般的都会有这个请求头的限定
    'Host': 'image.so.com'
    # 这个是指要访问的主机
}


def parse_cover_page(page):

    html = requests.get(url='https://image.so.com/zj?ch=beauty&sn={page}&listtype=new&temp=1'.format(page=page),headers=headers,verify=False)
    sleep(2)
    json_res = html.json()
    if 'list' in json_res:
        for cover_image in json_res.get('list'):
            #cover_imgurl = cover_image.get('cover_imgurl')
            # 套图的封面图片链接
            group_title = cover_image.get('group_title')
            # 这个是套图的标题
            gro_id = cover_image.get('id')
            # 提取这个套图的id
            params = {'ch':'beauty','id':gro_id}
            params = urlencode(params)
            # 构造链接的参数
            url = 'https://image.so.com/zvj?'+params
            print(url)
            parse_one_group_pic(url,group_title)



def parse_one_group_pic(url,group_title):
        html = requests.get(url=url,headers=headers,verify=False)
        sleep(0.5)
        if 'list' in html.json():
            for pic in html.json().get('list'):
                pic_url = pic.get('pic_url')
                pic_index = pic.get('index')
                if not os.path.exists('D:/pictures/{nam}'.format(nam=group_title)):
                    os.makedirs('D:/pictures/{nam}'.format(nam=group_title))
                    # 对文件夹的创建
                with open('D:/pictures/{nam}/{pic_index}.jpg'.format(nam=group_title,pic_index=pic_index),'wb') as f:
                    f.write(requests.get(url=pic_url,headers=headers,verify=False).content)
                    sleep(0.2)

if  __name__ == "__main__":
    for page in range(0,91,30):
        parse_cover_page(page)

猜你喜欢

转载自blog.csdn.net/killeri/article/details/80403745

我觉得我写的爬图片的代码看着很舒服

python猜数字小游戏（我当初是怎么想的，看着都觉得蠢）

我觉得，我认为。。。

“我在故宫写代码”

eclipse进行java代码编写时，最舒服的字体是什么？courier new字体，我感觉是最舒服的

我用Java写的第一个爬虫Demo-爬图片

我觉得代码是个艺术品，她很美

我认为写的好的代码

我的网络爬虫，nodejs图片爬取

我只写注释 —— 让Ai写代码

我觉得我有必要保存一个整数快读的代码

爸爸，我觉得我不棒

我觉得我就是小牛批

银行我觉得挺好呀^^

我觉得总结的不错的entityFramework

面试官问我NIO，我舒服了

一键生成前后端代码，Mybatis-Plus代码生成器让我舒服了

推荐本书《系统程序员成长计划》，我觉得写的不错

找到我，让我来陪你写代码！

学妹来北京想吃烤鸭，我写100行代码爬了两千个短评，就为了证明~

送别了我的师父，我觉得我的青春结束了

送别我的Leader，我觉得我的青春结束了

我,一个写代码的

2020年我要这样写代码

我写的 Python 代码，同事都说好

嘿ChatGPT，来帮我写代码

让chatgpt给我写影评，写《功夫》影评，不少于500字，大家觉得水平如何。

同事的接口文档我每次看着就头大，毛病多多。。。

车载开发：Android程序员请好好的看着我

直接裁7000！任正非：我不要你觉得，我要我觉得

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)