超热门表情包app爬虫

最近和同事和朋友斗图斗得厉害,心想哪里来的这么多表情包,于是乎想着去表情包网站爬一波图片下来,便有了今天这篇文章。

-----难度指数 ✩
-----阅读本文大概需要12分

爬虫案例100篇栏目的第一篇

由于app爬虫网上的例子较少,今后的爬虫以手机包为主。

选择表情包软件

超热门表情包app
在这里插入图片描述

开发环境

python3.6
ios13
mac os
pycharm
charler

抓包

抓包工具使用的是charler软件,手机配置好代理后打开抓包工具,不会配置的可以参考我之前的文章也可以网上搜。
在这里插入图片描述
打开软件我就看最热的图黄,就抓这个栏目,耶稣也拦不住了。

找呀找呀找
咦?jpg在这里插入图片描述
找到了,复制链接浏览器打开。woc居然连反爬都没有直接返回json。

代码:

import requests
from multiprocessing.dummy import Pool as mp
import os
from urllib.request import urlretrieve


def down_img(path, url):
    f_path = './img/'
    if not os.path.exists(f_path):
        os.makedirs(f_path)

    urlretrieve(url, f_path + path)


def get_json(page):
    res = requests.get("http://service.aemoji.adesk.com/v1/resource?limit=60&order=hot&skip={}".format(page))
    for data in (res.json()['res']['data']):
        down_img(data['uid']+'.jpg', data['static_url'])


if __name__ == '__main__':
    pool = mp(16)

    for page in range(0, 1000, 60):
        pool.apply_async(get_json, args=(page,))

    pool.close()
    pool.join()

现在,一个简单抓斗图app的爬就结束了。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_37275405/article/details/101566512