零基础入门python爬虫，采集豆瓣网电影排名top250！ - 代码天地

零基础入门python爬虫，采集豆瓣网电影排名top250！

编程语言 2019-03-26 14:50:50 阅读次数: 0

版权声明：禁止转载至其它平台，转载至博客需带上此文链接。 https://blog.csdn.net/qq_41841569/article/details/88819795

我们进入豆瓣电影排名首页后可以看到它的url为：

https://movie.douban.com/top250?

当然在学习Python的道路上肯定会困难，没有好的学习资料，怎么去学习呢？学习Python中有不明白推荐加入交流群号：683380553 群里有志同道合的小伙伴，互帮互助，群里有不错的视频学习教程和PDF！

翻一页进入第二页后可以看到url变成了：

https://movie.douban.com/top250?start=25&filter=

那么我们就得到一个规律了，第一页url的start参数为0，第二页为25，同理第三页为50。

总共有10页，那么我们可以构建一个变动的url。

for page in range(0, 11):
  url = 'https://movie.douban.com/top250?start={}&filter='.format(page*25)

对于采集电影的名字，我们可以打开网站的源代码，从中用正则提取出来。

res = re.compile(r’<img width=“100” alt="(.*?)" src="’)

全部源代码为：

显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：显示结果：

猜你喜欢

转载自blog.csdn.net/qq_41841569/article/details/88819795

零基础入门python爬虫，采集豆瓣网电影排名top250！

零基础爬虫----python爬取豆瓣电影top250的信息

零基础Python爬虫实战：豆瓣电影TOP250

零基础爬虫----python爬取豆瓣电影top250的信息（转）

Python爬虫零基础（以爬豆瓣电影top250为例，尝试自己写爬豆瓣读书top250的代码）

python爬虫入门:豆瓣电影Top250抓取

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫——豆瓣电影Top250

【python爬虫】—豆瓣电影Top250

【C语言爬虫】采集豆瓣电影top250

python爬虫 —— 豆瓣电影top250电影

Python网络爬虫数据采集实战：豆瓣电影top250爬取

爬虫基础---简单使用（附带豆瓣电影top250）

Python 爬虫实践-豆瓣电影Top250（待续）

Python爬虫获取豆瓣电影TOP250

（十七）Python爬虫：爬取豆瓣电影TOP250

python爬虫--爬取豆瓣top250电影名

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

Python爬虫一：抓取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

python爬虫爬取豆瓣电影TOP250

python爬虫——爬取豆瓣top250电影信息

Python爬虫抓取豆瓣top250电影

爬虫_豆瓣电影top250

豆瓣TOP250 电影爬虫

爬虫豆瓣TOP250电影数据

豆瓣电影top250（网络爬虫）

Python实现豆瓣电影TOP250

python 爬虫豆瓣top250

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)