python爬虫学习(四)豆瓣电影分类top100

豆瓣喜剧分类top100
当下拉的时候发现也是用了Ajax
找到url后发现带了参数
分析发现最后两次参数的意义并修改

# -*- coding: utf-8 -*-

import requests
import json
if __name__ == '__main__':
    url= 'https://movie.douban.com/j/chart/top_list'

    #参数
    param={
        'type': '24',
        'interval_id': '100:90',
        'action':'',
        'start': '0',  #从库中的第几部开始取
        'limit': '100'   #一次取出的个数
    }

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'
    }

    response=requests.get(url=url,params=param,headers=headers)

    list_data=response.json()

    fp=open('./douban.json','w',encoding='utf-8')
    json.dump(list_data,fp=fp,ensure_ascii=False)

    print('完成')
发布了23 篇原创文章 · 获赞 0 · 访问量 677

猜你喜欢

转载自blog.csdn.net/haimian_baba/article/details/103702923
今日推荐