爬取视频网站视频并下载 - 代码天地

爬取视频网站视频并下载

企业开发 2020-04-20 18:20:15 阅读次数: 0

import requests
import os
import json
import time
import re
from retrying import retry

"""
爬虫*six room
"""
def change_title(file):
    """替换非法字符"""
    pattern = re.compile(r"[\/\\\:\*\?\"\<\>\|]")
    file_name = re.sub(pattern,"_",file)
    return file_name

def mp4_download_json():
    for pages in range(1,101):
        print("\033[31;1m==========正在抓取第{}页的数据==========\033[0m".format(str(pages)))
        url = "https://v.6.cn/minivideo/getlist.php?act=recommend&page={}&pagesize=20".format(pages)
        headers = {
            'user-agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Mobile Safari/537.36'
        }
        response = requests.get(url,headers=headers)
        html = response.text
        # print(html)
        dict_data = json.loads(html)
        data_list = dict_data['content']['list']
        # print(data_list)

        for data in data_list:
            time.sleep(1)
            mp4_url = data['playurl']
            response = requests.get(mp4_url,headers=headers)
            file_name = data['title']
            new_filename = change_title(file_name)
            # print(file_name)
            if not os.path.exists(new_filename):
                os.mkdir(new_filename)
            print("\033[31;1m正在下载\033[0m %s"%(new_filename))
            with open(new_filename +'/'+new_filename+'.mp4','wb') as f:
                f.write(response.content)
                print("\033[32;1m%s~~~下载完成。\033[m\r\n"%(new_filename))

if __name__ == "__main__":
    mp4_download_json()

猜你喜欢

转载自blog.51cto.com/12629984/2488756

爬取视频网站视频并下载

python之梨视频网站视频爬取及下载

爬取视频网站的视频

爬取小视频网站视频并下载——场库网站视频批量下载

Python爬取全民小视频网站视频，可爬取全站视频

Python每日爬虫案例：爬取梨视频网站，下载完整版小视频并保存本地

Python - 下载视频网站的视频

下载各视频网站的视频

scrapy爬取某视频网站的部分视频信息

视频网站防止下载，付费视频网站防止下载，防止视频资源被下载

下载测试小视频网站

java视频网站源码下载

提取视频网站

军事视频网站

视频网站的设计

视频网站项目

轻松下载各大视频网站的 .Flv 视频

使用you-get工具下载视频网站的视频

Python爬取不知名短视频网站，别说这网站还有点像Youtube

视频网站源码下载使用，设置大秦视频网站主题

cms视频网站源码下载，大秦cms视频网站源码介绍

付费视频网站防止下载，付费视频网站效果，付费视频点播系统源码

视频网站的现状分析

ThinkPHP学习视频网站

视频网站开发

秒搭视频网站

爬取视频解析网站的解析接口

Python爬虫：爬取网站视频

视频网站或者网站中有视频，如何阻止迅雷劫持下载

爬虫的基本原理、requests模块、模拟登陆网站、爬取视频网站、cookie池和代理池、正向代理和反向代理

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)