python 爬取豆瓣电影案例 - 代码天地

python 爬取豆瓣电影案例

其他 2018-05-05 14:50:06 阅读次数: 4

# conding=utf-8
from  parse import parse_url
import json
class DoubanSpider:

    def __init__(self):

        self.temp_url = "https://m.douban.com/rexxar/api/v2/subject_collection/filter_movie_occident_hot/items?os=android&for_mobile=1&callback=jsonp3&start={}&count=18&loc_id=108288&_=0"


    def get_content_list(self,html_str): #提取数据

        dict_data = json.loads(html_str)

        content_list = dict_data["subject_collection_items"]

        total =dict_data["total"]

        return content_list,total


    def save_content_list(self,content_list):

        with open("db.json","a",encoding="utf-8") as f:

            for content in content_list:

                f.write(json.dumps(content,ensure_ascii=False))

                f.write("\n")
                print('添加成功')

    def run(self): #实现主要逻辑

        num = 0

        total = 100

        while num < total + 18:
            # 1.start_url
            start_url = self.temp_url.format(num)

            # 2.发送请求,获取响应
            html_str = parse_url(start_url)

            # 3.提取数据
            content_list, total = self.get_content_list(html_str)

            # 4.保存
            self.save_content_list(content_list)

            # 5.构造下一页的url地址,循环2-5步
            num +=18



if __name__== '__main__':
        douban = DoubanSpider()
        douban.run()

猜你喜欢

转载自www.cnblogs.com/zqrios/p/8994713.html

python 爬取豆瓣电影案例

Python实现的爬取豆瓣电影信息功能案例

Python爬取豆瓣电影

python爬虫，爬取豆瓣电影信息

python爬虫实践——爬取豆瓣电影

python爬虫爬取豆瓣电影信息

Python爬取豆瓣电影top

使用Python 爬取豆瓣热门电影

Python爬虫--爬取豆瓣电影

Python爬虫经典案例详解：爬取豆瓣电影写入Excel表格

案例学python——案例三：豆瓣电影信息入库一起学爬虫——通过爬取豆瓣电影top250学习requests库的使用

Python爬取猫眼电影案例

Python爬虫之爬取豆瓣电影（一）

Python爬虫入门 | 2 爬取豆瓣电影信息

爬取豆瓣电影top250（python3）

Python爬虫之爬取豆瓣电影（二）

Python爬虫实战：Scrapy豆瓣电影爬取

python爬取豆瓣电影Top250

python3.0以上版本爬取豆瓣电影

Python爬取豆瓣动作电影好评前100名

（十七）Python爬虫：爬取豆瓣电影TOP250

Python网络爬虫学习之爬取豆瓣电影（四）

python爬虫--爬取豆瓣top250电影名

python爬取豆瓣电影Top250的信息

用Python爬取豆瓣Top250的电影标题

Python爬取豆瓣高分电影前250名

Python爬取豆瓣电影:《肖申克的救赎》

python 爬虫&爬取豆瓣电影top250

python3爬虫 —— 爬取豆瓣电影信息

Ajax爬取豆瓣“奥特曼”电影目录（Python）

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

VS2017编译opensmile具体过程和遇到的问题

PowerEnglish——mini-story3总结

微信小程序数据库获取字符串在view中显示换行

Java静态代码块/构造代码块/构造函数/静态变量/成员变量(相关示例)

Keras使用tensorflowjs部署demo

window下用git连接Github

图象的全变分和去噪

LeetCode刷题笔记--119. Pascal's Triangle II

【Linux】进程间通信 - 管道

polyA|ribo-minus|differentiated cell|Genetic heterogeneity

每日归档

更多

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)