电影天堂电影链接爬取 - 代码天地

电影天堂电影链接爬取

其他 2018-08-19 23:41:06 阅读次数: 0

 1 import requests,re
 2 
 3 
 4 def getdetail(url):
 5 
 6     response = requests.get(url)
 7     html = response.content.decode('gbk')
 8     # 电影详情页标题
 9     movie_title_name = re.search('<h1><font color=#07519a>(.*)</f',html)
10     movie_title = movie_title_name.group(1)
11     # 电影 磁力   magnet
12     movie_magnet_url = re.search('/><a href="(.*)"><str',html)
13     # print(movie_magnet.group(1))
14     movie_magnet = movie_magnet_url.group(1)
15     # torrent种子
16     movie_torrent_url = re.search('ddf"><a href="(.*)">ft',html)
17     movie_torrent = movie_torrent_url.group(1)
18     # print(movie_torrent.group(1))
19     # 这个列表用来title
20     movie_title_list = []
21     movie_title_list.append(movie_title)
22 
23     # 这个列表两个下载的链接
24     movie_down_url = []
25     movie_down_url.append(movie_magnet)
26     movie_down_url.append(movie_torrent)
27     movie_down_url_all = []
28     movie_down_url_all.append(movie_down_url)
29 
30 
31     movie_dict = dict(zip(movie_title_list,movie_down_url_all))
32     print(movie_dict)
33 
34 
35 
36 def getpage():
37 
38     for i in range(1,178):
39         lurl = 'http://www.dytt8.net/html/gndy/dyzz/list_23_%s.html' % i
40 
41         response = requests.get(lurl)
42 
43         html = response.text
44 
45         movie_url_list = re.findall('<a href="(.*)" class="ulink"',html)
46 
47         for movie_item in movie_url_list:
48             movie_url = 'http://www.dytt8.net'+movie_item
49             getdetail(movie_url)
50 
51 
52 if __name__ == '__main__':
53     getpage()

猜你喜欢

转载自www.cnblogs.com/daihao9527/p/9503189.html

电影天堂电影链接爬取

爬虫爬取电影天堂电影链接

爬取电影天堂

爬取电影天堂最新电影的名称和下载链接

Python爬取电影天堂

电影天堂数据爬取

python 爬取电影天堂电影

python 爬取电影天堂电影续编

爬取电影天堂电影磁力

爬虫学习（一）---爬取电影天堂下载链接

python爬虫——爬取电影天堂磁力链接

Python笔记6——爬取电影天堂链接

爬取电影天堂最新电影的名称和下载链接(增量爬取mysql存储版)

[python爬虫]爬取电影天堂连接

零基础爬取电影天堂

电影天堂爬取详情页

XPath之电影天堂数据爬取

爬虫之爬取电影天堂（request）

Scrapy爬虫爬取电影天堂

xpath；；利用xpath爬取电影天堂

Python实现爬取电影天堂最新电影资源

python3 爬取电影天堂最新电影

BeautifulSoup爬取电影天堂全站电影资源

爬取电影天堂电影列表和详情页

爬取《电影天堂》，保存评分大于7.0 的电影地址

爬取电影天堂资源并实现下载视频资源

python实现电影天堂种子磁力的爬取

requests+lxml+xpath爬取电影天堂

爬取电影天堂-二级页面抓取

爬虫11-爬取复杂网页，电影天堂

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)