stable diffusion模型训练时数据量 - 代码天地

stable diffusion模型训练时数据量

企业开发 2023-09-30 09:50:46 阅读次数: 0

文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易，求点赞！ https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC（AI Generated Content）元年，上半年有文生图大模型DALL-E2和Stable Diffusion，下半年有OpenAI的文本对话大模型Ch…https://zhuanlan.zhihu.com/p/6171348931.数据集

1.1 laion数据集

laion2B-en数据集，是laion5B的一个子集，更具体的说它是laion-5B中的英文数据集，laion-5B是从网页数据common crawel中筛选出来的图像文本对，包含5.85B的图像文本对，其中文本为英文的数据量为2.32B，这就是laion-2B-en数据集。

图片的width和height均在256以上的样本量为1324M，在512以上的是488M，在1024以上为76M，文本平均长度为67.

1.2 WUkong数据集

包括1亿对图文对

2.模型训练

扫描二维码关注公众号，回复： 16891841 查看本文章

2.1 runwayml 1.5

在laion-2B-en数据集上评分为5以上训练的，先用256x256，再用512x512，用了32台8卡A100 40G，bs=32x8x2x2=2048。训练了150000小时，大约25天。

2.2 stability 2.0

在laion-2B-en数据集上评分为4.5以上训练的，

2.3 stability 2.1

sd 2.1在sd 2.0基础上放开了一些nsfw过滤掉的数据，

2.2 mosicML sd 2

使用laion-5B的一个子集，其中包括带有纯英文标题且审美得分为4.5+的样本，第一阶段使用分辨率大于256x256的0.79B样本，第二阶段使用大于512x512的0.3B样本，128台A100，第一个阶段耗时1.6天，55万次迭代，第二阶段耗时4.9天，85万次迭代。

2.3 pai-diffusion

用Wukong数据集中的2千万中文图文数据对进行了约20天的预训练。

2.4 chineseclip

laion-5B中的zh文本大概1.1亿，悟空的7千万，加一下自有数据，总量大概2亿。

猜你喜欢

转载自blog.csdn.net/u012193416/article/details/133232661

stable diffusion模型训练时数据量

Stable Diffusion训练Lora模型

stable diffusion

stable diffusion模型讲解

Stable Diffusion模型概述

Stable diffusion扩散模型相关

Stable Diffusion模型阅读笔记

stable diffusion模型评价框架

Stable Diffusion常用设置

Stable Diffusion11

Stable Diffusion原理详解

stable diffusion demo

stable diffusion使用入门

【Stable Diffusion】什么是VAE

Stable Diffusion~14 is Unstable

stable diffusion硬件要求

stable diffusion（杂谈）

【Stable Diffusion】什么是Embedding

Stable Diffusion 是如何运行的

Stable Diffusion XL 0.9

【深度学习】Stable Diffusion

Stable Diffusion学习笔记

Stable Diffusion绘画入门

linux部署stable diffusion

Stable Diffusion原理说明

Stable Diffusion~树莓派

Stable Diffusion XL搭建

Stable Diffusion XL 1.0

AI绘画Stable Diffusion

Stable Diffusion代码简介

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)