Python爬虫入门之豆瓣短评爬取 - 代码天地

Python爬虫入门之豆瓣短评爬取

编程语言 2018-11-30 19:23:03 阅读次数: 0

采用工具pyCharm，python3，工具的安装在这就不多说了，之所以采用python3是因为python2只更新维护到2020年。

新建python项目
File-Settings-project interpreter，点右上角+号，安装requests，lxml，openpyxl，pandas四个包。
requests爬取豆瓣短评
lxml解析定位豆瓣短评
panda转换并保存豆瓣短评数据
openpyxl是读写excel文件所用到的包
在项目下新建一个python file，实例代码如下：
这里着重说一下，xpath路径如何获取，在网页中选中评论内容，右击-检查，自动跳到对应代码行，再在该代码行上右击-Copy-Copy XPath；粘贴出来你的代码好比如是：//[@id=“comments”]/ul[1]/li[1]/div[2]/p/span，这时你要结合你的前端基础知识和页面世界节点去分析，最后把xpath改成//[@class=“comment”]/p/span/text()
运行代码，在项目目录下生成comments.xlsx文件。大功告成！

猜你喜欢

转载自blog.csdn.net/qq_33496991/article/details/84647242

Python爬虫入门之豆瓣短评爬取

Python爬虫（入门+进阶）学习笔记 1-3 使用Requests爬取豆瓣短评

python爬取豆瓣网页短评实战！

Python爬取豆瓣指定书籍的短评

python爬虫-爬取爱情公寓电影（2018）豆瓣短评并数据分析

python爬虫，Scrapy爬取豆瓣电影《芳华》电影短评，分词生成词云图。

python爬虫，爬取豆瓣电影《芳华》电影短评，分词生成云图。

初学爬取豆瓣哪吒之魔童降世短评

详解使用Python爬取豆瓣短评并绘制词云

python 爬取豆瓣电影短评并wordcloud生成词云图

python爬取豆瓣网花木兰短评

python实例：自动爬取豆瓣读书短评，分析短评内容

Python爬虫入门 | 2 爬取豆瓣电影信息

python爬虫入门 ✦ 爬取豆瓣电影Top250

Python爬虫入门 | 爬取豆瓣电影信息

爬取豆瓣短评并输出词云

爬取豆瓣头号玩家短评

《恶魔人crybaby》豆瓣短评爬取

Python爬虫之爬取豆瓣电影（一）

Python爬虫之爬取豆瓣电影（二）

python之简单爬虫（爬取豆瓣出版社）

Python网络爬虫学习之爬取豆瓣电影（四）

python爬虫之爬取豆瓣电影top250

爬虫之爬取豆瓣图书的评论

爬虫之爬取豆瓣电影的名字

用python爬豆瓣电影《热烈》短评

python爬虫，爬取豆瓣电影信息

python爬虫实践——爬取豆瓣电影

python爬虫爬取豆瓣电影信息

python爬虫 - 爬取豆瓣上的数据

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)