【PY】没有电影看？来教你用Python爬取电影天堂最新电影！ - 代码天地

【PY】没有电影看？来教你用Python爬取电影天堂最新电影！

其他 2019-10-26 14:50:47 阅读次数: 0

项目开始

第一步仍然是创建scrapy项目与spider文件

切换到工作目录两条命令依次输入

scrapy startproject xunleidianying
scrapy genspider xunleiBT https://www.xl720.com/thunder/years/2019

内容分析

打开目标网站（分类是2019年上映的电影），分析我们需要的数据

进入页面是列表的形式就像豆瓣电影一样，然后我们点进去具体页面看看

这个页面就是我们需要拿到的内容页面，我们来看我们需要哪些数据(某些数据从第一个页面就可以获得，但是下载地址必须到第二个页面)

电影名称
电影信息
电影内容剧情
电影下载地址

分析完成之后就可以首先编写 items.py文件

另外别忘了去settings.py中开启 ITEM_PIPELINES 选项

爬虫文件编写

老样子，为了方便测试我们的爬虫，首先编写一个main.py的文件方便IDE调用

main.py：

import scrapy.cmdline
scrapy.cmdline.execute('scrapy crawl xunleiBT'.split())

首先我们先测试直接向目标发送请求是否可以得到响应

爬虫文件 xunleiBT.py编写如下：

运行 main.py 看看会出现什么

好的，发现直接返回正常的网页也就是我们要的网页，说明该网站没有反爬机制，这样我们就更容易爬取了

然后通过xpath定位页面元素，具体就不再赘述，之前的scarpy教程中都有继续编写爬虫文件

ITEM爬取完成后该干什么？当然是入库保存了，编写pipelines.py文件进行入库保存

再次提醒别忘了去settings.py中开启 ITEM_PIPELINES 选项

pipelines.py文件代码如下：

再次运行main.py 等待运行完成后打开数据库查询

数据保存完成，这次我们一共导入了380个数据，可以愉快的查看电影了

猜你喜欢

转载自www.cnblogs.com/qingdeng123/p/11743065.html

【PY】没有电影看？来教你用Python爬取电影天堂最新电影！

教你如何用python来爬取电影天堂上面的电影

Python实现爬取电影天堂最新电影资源

python3 爬取电影天堂最新电影

python 爬取电影天堂电影续编

python 爬取电影天堂电影

Python爬取电影天堂

爬取电影天堂

爬取电影天堂最新电影的名称和下载链接

[python爬虫]爬取电影天堂连接

电影天堂电影链接爬取

爬取电影天堂电影磁力

爬虫爬取电影天堂电影链接

python利用requests模块，实现爬取电影天堂最新电影信息。

电影天堂数据爬取

爬取电影天堂最新电影的名称和下载链接(增量爬取mysql存储版)

scrapy入门小案例--爬取电影天堂最新电影下载地址

利用requests和lxml库爬取电影天堂中最新电影前10页

爬虫(9)实战爬取电影天堂的1000+最新电影

python实现电影天堂种子磁力的爬取

python爬虫——爬取电影天堂磁力链接

Python笔记6——爬取电影天堂链接

BeautifulSoup爬取电影天堂全站电影资源

爬取电影天堂电影列表和详情页

爬取《电影天堂》，保存评分大于7.0 的电影地址

零基础爬取电影天堂

电影天堂爬取详情页

XPath之电影天堂数据爬取

爬虫之爬取电影天堂（request）

Scrapy爬虫爬取电影天堂

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)