豆瓣书评爬虫 - 代码天地

豆瓣书评爬虫

其他 2018-07-04 00:06:14 阅读次数: 0

版权声明：未经允许，随意转载，请附上本文链接谢谢（づ￣3￣）づ╭❤～
https://blog.csdn.net/xiaoduan_/article/details/80835248

豆瓣书评爬虫

一年前学的爬虫，忘得差不多了，现在复习一下
最近读了《白夜行》，就拿它下手喽

import requests
from lxml import etree
import pandas as pd
import time

data = []
def get_userdata(page):
    for i in range(1, page + 1):
        url = 'https://book.douban.com/subject/3259440/comments/hot?p={}'.format(i)
        print("正在爬取第{}页\n".format(i))
        print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))
        time.sleep(1)
        r = requests.get(url)
        s = etree.HTML(r.text)

        xiaodata = s.xpath('//div[@id="comments"]//div/p/text()')

        data.extend(xiaodata)

if __name__ == '__main__':
    get_userdata(20)
    df = pd.DataFrame(data)
    df.to_csv('白夜行.csv', encoding='utf-8-sig')
    print("任务完成")

最后结果，爬20页意思意思就好啦

猜你喜欢

转载自blog.csdn.net/xiaoduan_/article/details/80835248

豆瓣书评爬虫

爬取豆瓣书评

爬虫练手小实例---【2018年豆瓣书评9.0以上书籍】

Python爬虫豆瓣读书评分9分以上榜单

用requests 爬取豆瓣书评的评论

豆瓣爬虫

Python爬取豆瓣网图书评论

初探豆瓣爬虫

Python 爬虫-豆瓣读书

爬虫豆瓣电影

爬虫：模拟登录豆瓣

豆瓣电影爬虫+分析

豆瓣影评爬虫

爬虫豆瓣美女

豆瓣上映电影爬虫

Python 豆瓣爬虫

Python爬虫——豆瓣读书

豆瓣电影爬虫

PHP编写豆瓣爬虫

python豆瓣电影爬虫

豆瓣电影爬虫练习

【爬虫】总结-豆瓣电影

爬虫实战—豆瓣图书爬虫

这本免费的编程书籍向大家推荐，豆瓣书评9.1分！

python系列之（4）豆瓣图书《平凡的世界》书评及情感分析

爬虫：豆瓣top250

爬虫（AJEX）——豆瓣动态页面

豆瓣爬虫，用pandas分析。

豆瓣爬虫（从剧名获取ID）

豆瓣电影爬虫编写教程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)