python--爬取豆瓣热门国产电视剧保存为文件 - 代码天地

python--爬取豆瓣热门国产电视剧保存为文件

其他 2018-09-08 19:29:22 阅读次数: 0

# -*- coding: utf-8 -*-
__author__ = 'Frank Li'
import requests
import json

class HotSpider(object):
    def __init__(self):
        self.url = "https://m.douban.com/rexxar/api/v2/subject_collection/filter_tv_domestic_hot/items?os=android&for_mobile=1&start={}&count=18&loc_id=108288"
        self.session = requests.session()
        self.headers = {"Referer": "https://m.douban.com/tv/chinese",
                        "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Mobile Safari/537.36"}

    def parse_2_list_from_str(self,url):
        return json.loads(self.session.get(url,headers=self.headers).content.decode())['subject_collection_items']

    def save_as_file(self,content_list,file):
        with open(file,'a',encoding='utf-8') as f:
            for content in content_list:
                f.write(json.dumps(content,ensure_ascii=False))
                f.write('\n')

    def run(self):
        url = self.url.format(0)
        num = 0
        total = 500
        while num<total+18:
            print(url)
            self.save_as_file(self.parse_2_list_from_str(url),'hot.json')
            num+=18
            url=self.url.format(num)

if __name__ == '__main__':
    hot_spider = HotSpider()
    hot_spider.run()

猜你喜欢

转载自www.cnblogs.com/Frank99/p/9610069.html

python--爬取豆瓣热门国产电视剧保存为文件

requests库爬取豆瓣热门国产电视剧数据并保存到本地

python爬虫爬取豆瓣电视剧数据

Python爬虫豆瓣国产电视剧

国产优秀电视剧

Python爬虫学习笔记(2) _豆瓣电影TOP250(2)爬取详细数据，保存为CSV文件【urllib、request、bs4、error、CSV】

python从入门到放弃篇33（selenium库）实现翻页爬取豆瓣小说，保存为xlsx文件到本地

爬取爱奇艺的热播电视剧

爬取芒果TV电视剧排行榜

Python爬取电影天堂指定电视剧或者电影

Python 爬取数电教案并保存为pdf

python爬取数据保存为图片

python爬取数据保存为MySQl格式

python爬取数据保存为txt格式

python爬取数据保存为Json格式

python爬取多个网页表格并保存为csv

python爬取昵称并保存为vss

python中Scrapy实战之爬取网页并保存为json文件

python爬取中国天气网天气并保存为word格式文件

python爬取中国天气网天气并保存为csv格式文件

【Python爬虫】使用美味汤BeautifulSoup爬取数据并保存为Excel文件

python爬取安居客地图页信息，并保存为csv文件

豆瓣排名前500的电视剧

python爬爱奇艺电视剧及剧集链接

Python爬虫：爬去韩国电视剧信息

纵观 30 年 5000 多部国产电视剧，豆瓣评分最低的演员原来是……

python 利用scrapy爬取豆瓣TOP250部电影信息分别保存为csv、json、存入mysql、下载海报图片

Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析

Python抓取电视剧《天盛长歌》豆瓣短评，并制作成词云。

Android爬虫Jsoup爬取某招聘网站数据并保存为exceL文件

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)