AIGC笔记--基于DDPM实现图片生成 - 代码天地

AIGC笔记--基于DDPM实现图片生成

企业开发 2023-12-16 23:34:34 阅读次数: 0

目录

1--扩散模型

2--训练过程

3--损失函数

4--生成过程

1--扩散模型

完整代码：ljf69/DDPM

扩散模型包含两个过程，前向扩散过程和反向生成过程。

前向扩散过程对一张图像逐渐添加高斯噪声，直至图像变为随机噪声。

反向生成过程从一个随机噪声开始，逐渐去噪声直至生成一张图像。

2--训练过程

通过以下公式对图像进行加噪：

def forward(self, x0, t, eta = None):
    n, c, h, w = x0.shape # 输入图片的shape
    a_bar = self.alpha_bars[t]
    if eta is None:
        eta = torch.randn(n, c, h, w).to(self.device)
    noisy = a_bar.sqrt().reshape(n, 1, 1, 1) * x0 + (1 - a_bar).sqrt().reshape(n, 1, 1, 1) * eta # 加噪
    return noisy # 返回加噪结果

3--损失函数

通过一个UNet网络来预测损失，计算预测损失和真实损失MSE损失：

...
eta = torch.randn_like(x0).to(device) # 产生真实随机噪声
t = torch.randint(0, n_steps, (n,)).to(device)

# 前向扩散过程
noisy_imgs = ddpm(x0, t, eta)

# 通过UNet预测噪声
eta_theta = ddpm.backward(noisy_imgs, t.reshape(n, -1))

# 计算预测噪声和真实随机噪声的MSE损失
loss = mse(eta_theta, eta)
...

4--生成过程

通过以下公式实现图片生成：

x = torch.randn(n_samples, c, h, w).to(device) # 随机初始化噪声
for idx, t in enumerate(list(range(ddpm.n_steps))[::-1]):
    time_tensor = (torch.ones(n_samples, 1) * t).to(device).long()
    eta_theta = ddpm.backward(x, time_tensor)
    alpha_t = ddpm.alphas[t]
    alpha_t_bar = ddpm.alpha_bars[t]

    x = (1 / alpha_t.sqrt()) * (x - (1 - alpha_t) / (1 - alpha_t_bar).sqrt() * eta_theta) # 去噪
    if t > 0:
        z = torch.randn(n_samples, c, h, w).to(device)
        beta_t = ddpm.betas[t]
        sigma_t = beta_t.sqrt()
        x = x + sigma_t * z

5--参考

怎么理解今年 CV 比较火的扩散模型（DDPM）

猜你喜欢

转载自blog.csdn.net/weixin_43863869/article/details/133997567

AIGC笔记--基于DDPM实现图片生成

Diffusion扩散模型学习1——Pytorch搭建DDPM实现图片生成

【AIGC】4、DDPM 简介 | 使用随机噪声来生成图像

DDPM模型——pytorch实现

AIGC 基础，从VAE到DDPM 原理、代码详解

AIGC-从代码角度去理解DDPM(扩散模型)

AIGC系列之：DDPM原理解读（简单易懂版）

各种文字生成图片的AIGC模型（openAI、谷歌、stable、Midjourney等）

分享15个全球顶尖的AIGC图片生成平台

生成式人工智能笔记-AIGC笔记

基于canvas实现图片文字水印生成器

Diffusion 扩散模型DDPM【俺的学习笔记】

Django笔记（Django实现生成图片验证码）

Matalb实现基于生成对抗网络（GAN）的图片生成——附代码

aigc图像生成技术

AIGC - 生成模型

各种生成模型：VAE、GAN、flow、DDPM、autoregressive models

【生成模型】DDPM概率扩散模型（原理+代码)

VisorGPT: 如何基于 GPT 和 AIGC 模型定制一个可控的生成模型

基于Huggingface完成text-to-image的文本生成图像实例(AIGC)--零基础

基于Gradio/Stable Diffusion/Midjourney的AIGC自动图像绘画生成软件 - Fooocus

基于参考物体的AIGC图像生成技术在家居导购领域的应用

扩散模型-2020-理论基础：DDPM【目前“文本生图像”所采用的扩散模型大都是来自于DDPM】【输入：带噪音的图片+文本+噪音程度值；输出：待去除的噪音】【带噪音的图片-输出的噪音=生成的图片】

【Python_Scrapy学习笔记（十三）】基于Scrapy框架的图片管道实现图片抓取

JAVA实现基于ZXing的二维码自动生成与图片合成

基于Velocity模版引擎实现动态生成Word文档，支持插入图片

基于Python的文字生成图片系统

手动实现一个扩散模型DDPM

AIGC：通过 ChatGPT 和 Mermaid 实现语言描述生成流程图实践

基于canvas实现图片压缩

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)