python3批量抓取电影天堂下载链接 - 代码天地

python3批量抓取电影天堂下载链接

其他 2019-01-10 11:00:56 阅读次数: 0

版权声明：本文为博主原创文章，转载请注明出处。 https://blog.csdn.net/qq_17054989/article/details/80087341

1.思路分析

首先打开电影天堂的列表页

右键审查元素查看电影简介的链接

将此链接打开可以得到下载地址

可能是爬虫原因网站审查元素和用request得到的数据不一样，因此代码的正则表达式会改变

加上列表循环便可以批量输出下载链接

2.代码

#!/usr/bin/env python
#-*-coding:utf-8-*-
__author__ = 'Qi zewen QQ群497719008'

import requests
import re
# import time
#批量爬取电影天堂电影下载链接
for n in range(1,175):
    a_url = 'http://www.dytt8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'                #网站地址
    html_1 = requests.get(a_url)                    #连接到网站，返回状态码
    html_1.encoding='gb2312'                        #改变网站编码为中文gb2312
    # print(html_1.text)
    detail_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)    #findall匹配正则表达式和网站代码获取 .text
    # print(detail_list)
    for m in detail_list:
        # time.sleep(0.2)
        # b_url = 'http://www.dytt8.net/{}'.format(m)
        b_url = 'http://www.dytt8.net/%s'%m
        html_2=requests.get(b_url)
        html_2.encoding='gb2312'
        # print(html_2.text)
        ftp = re.findall('<a href="(.*?)">ftp.*?</a></td>',html_2.text)
        if ftp != []:
            print (ftp[0])
        with open('dn.txt','a',encoding='utf-8') as f:
            #写文本write到本地
            if ftp != []:
                f.write(ftp[0]+'\n')

猜你喜欢

转载自blog.csdn.net/qq_17054989/article/details/80087341

python3批量抓取电影天堂下载链接

python3 电影天堂抓取

使用python3批量下载rbsp数据

使用python3批量下载网站图片

Python3批量下载.dat和.hea文件

实例练习----电影天堂抓取下载链接

python3批量为文件重命名

Python3批量转换文件编码

python3批量telnet脚本

Python3批量处理域名解析

python3抓取电影天堂存mysql出错如何解决？（已解决）

python3 爬取电影天堂最新电影

Python3批量修改文件名脚本

Python3批量合并excel 格式xlsx和xls都行

Python3批量修改文件名小工具

20230507使用python3批量转换DOCX文档为TXT

爬取电影天堂最新电影的名称和下载链接

20230508在Ubuntu22.04下使用python3批量转换DOCX文档为TXT

20230809在WIN10下使用python3批量将TXT文件转换为SRT文件

20230811在WIN11下使用python3批量将中英文的SRT格式的字幕合并

python3 爬虫抓取豆掰电影TOP 250

[Java] 用java实现的电影天堂,飘花电影网的电影的下载地址抓取

爬虫学习（一）---爬取电影天堂下载链接

网页视频解密下载 TS解密下载 M3U8批量下载

python3 抓取简书，增加浏览量

python爬虫——爬取电影天堂磁力链接

Python笔记6——爬取电影天堂链接

一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接

[云炬python3玩转机器学习笔记] 2-4批量学习、咋西安学习、参数学习和非参数学习

电影天堂python脚本

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)