解读Stable Video Diffusion：详细解读视频生成任务中的数据清理技术 - 代码天地

解读Stable Video Diffusion：详细解读视频生成任务中的数据清理技术

企业开发 2023-12-17 06:44:04 阅读次数: 0

Diffusion Models视频生成-博客汇总

前言：Stable Video Diffusion已经开源一周多了，技术报告《Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets》对数据清洗的部分描述非常详细，虽然没有开源源代码，但是博主正在尝试复现其中的操作。这篇博客先梳理一下Stable Video Diffusion的数据清洗部分。

原始收集数据集的缺点

(1)生成视频模型对运动不一致很敏感，例如剪切通常许多包含在原始和未处理的视频数据中。

(2) 字幕影响。理想情况下每个视频有对应的多个字幕。

级联剪辑

用了三个切割器以不同的帧速率和不同的阈值运行，以检测突然的变化和缓慢的变化，例如褪色。

关键帧剪辑

提取源视频中关键帧的时间戳并将检测到的切割捕获到不交叉检测到的切割最近的关键帧时间戳上。

光流得

猜你喜欢

转载自blog.csdn.net/qq_41895747/article/details/134547907

解读Stable Video Diffusion：详细解读视频生成任务中的数据清理技术

Stability AI 开源视频生成模型 Stable Video Diffusion

Video-to-Video论文解读

代码解读：Zero-shot 视频生成任务 Text2Video-Zero

Meta最新视频生成工具：emu video技术报告解读

Few-shot Video-to-Video(NeurIPS 2019)视频生成论文解读

【ICCV 2023 Oral】解读Text2Video-Zero：解锁 Zero-shot 视频生成任务

图片生成视频来了：Stable Video Diffusion使用教程

stable论文解读

详细解读ControlNet Stable Diffusion代码

AI视频-stable-video-diffusio介绍

AI 视频 | Stable Video Diffusion 来了！（附体验地址）

Stable Video Diffusion重磅发布：基于稳定扩散模型的AI生成视频

1分钟生成爆款风景视频，Stable Video Diffusion最简教程

多模态——使用stable-video-diffusion将图片生成视频

Mobicom20 Volumetric Video文章解读

论文解读：SlowFast Networks for Video Recognition

解读DreamPose：基于Diffusion Models的模特视频生成

Video Diffusion Models：基于扩散模型的视频生成

【SVD生成视频+可本地部署】ComfyUI使用（二）——使用Stable Video Diffusion生成视频（2023.11开源）

强大到离谱！硬核解读Stable Diffusion（完整版）

【SIGGRAPH 2023】解读Rerender A Video：Zero-Shot 视频翻译任务

论文解读：Less is More: Learning Highlight Detection from Video Duration

【CVPR 2023】解读LFDM：Conditional Image-to-Video Generation with Latent Flow Diffusion Models

Stable Diffusion的结构要被淘汰了吗？详细解读谷歌最新大杀器VideoPoet

AnimateDiff论文解读-基于Stable Diffusion文生图模型生成动画

LLaMA模型微调版本 Vicuna 和 Stable Vicuna 解读

卷爆 Sora ，Stable Video 免费开放！

全面解读视频生成模型Sora

万字长文解读Stable Diffusion的核心插件—ControlNet

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)