一段完整的批量下载网站视频资源的python爬虫代码（附注解） - 代码天地

一段完整的批量下载网站视频资源的python爬虫代码（附注解）

其他 2020-01-29 16:01:16 阅读次数: 0

# 本程序为学习代码，成功爬取了＇梨视频＇网站的全部视频文件，并保存在video文件夹
import os
import re
import requests

def getHTMLText(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("request failed")

url = 'https://www.pearvideo.com/category_8'
baseurl = 'https://www.pearvideo.com/'
video_data = getHTMLText(url)
# 判断是否已经有video文件夹，没有则新建
if not os.path.isdir('./video'):
    os.makedir('./video')

res = re.compile(r'(video_[0-9]{7})')
video_list = re.findall(res, video_data)


# 构建全部视频文件网址
for i in video_list:
    video_url = baseurl + i # video_url是视频文件页面的地址，不是真正的视频文件的下载地址
    # 请求视频文件网站url，读取视频文件内容
    try:
        text = getHTMLText(video_url) # 返回视频文件页面的html
        res = re.compile(r'srcUrl="(https://.+?mp4)"')
        final_url = re.findall(res, text)[0] # 返回真正的视频文件的下载地址
        video_content = requests.get(final_url).content # 获取视频文件的内容（二进制流）
    except:
        print('%s文件内容获取失败！' % i)
    with open('./video/' + i + '.mp4', 'wb') as f:
        print('正在保存视频 %s ......' % i)
        f.write(video_content)
        f.flush()

猜你喜欢

转载自www.cnblogs.com/iceberg710815/p/12240415.html

一段完整的批量下载网站视频资源的python爬虫代码（附注解）

python爬虫，一段完整的python爬虫批量下载网站图片资源的代码

一段Python爬虫代码的分析

写一段python代码爬壁纸网站

vedio标签播放视频，暂停一段时间再次播放，视频资源重新下载的问题处理

一段 Python 连接 elasticsearch 的代码

一段完整的创建表格的SQL代码

一段代码

关于详解一段爬虫代码（原创，启发自一段与师兄的对话）

分享一段确保删除资源的代码模型

java编写的一段简单的爬虫demo代码

一段实现网站倒转特效的javascript代码

Python爬虫实战：批量下载网站图片

一段Python

简单python网络爬虫批量下载视频

写一段爬虫程序，用python

Python 入门学习-第一段Python代码

一段测试代码

注释一段代码

一段代码的思考

一段AIO代码

一段练习的代码

一段神奇的代码

Python每日爬虫案例：爬取梨视频网站，下载完整版小视频并保存本地

一段代码让你学会Python （借鉴）

Python一段用于保密的自动销毁代码

让Python在退出时强制运行一段代码

Python：计算一段代码的执行时间

用Python写一段下雪的代码

能不能写一段NetworkX的PYTHON代码

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)