【PyTorch][chapter 228][李宏毅深度学习][Diffusion Model-1]

🕗 发布于 2024-11-26 08:57 人工智能

前言：

《Denoising Diffusion Probabilistic Models》

作者：Jonathan Ho, Ajay Jain, and Pieter Abbeel

一、模型原理

Diffusion Model的原理基于扩散过程，这个过程分为两个主要阶段：前向过程和反向过程。

前向过程：在前向过程中，模型对一张原始图片逐步施加噪声，直至图像被破坏变成完全的高斯噪声。这个过程中，每个时间步加入的噪声都是服从正态分布的。随着一步步加入噪声，每一步必须要加入更大的噪声才能看出加了噪声的效果。
反向过程：在反向过程中，模型学习从高斯噪声还原为原始图像的过程。这实际上是一个去噪过程，模型通过逐步去噪，最终得到一张清晰的图像。

二、模型架构

PyTorch Diffusion Model的模型架构通常包括一个神经网络，该网络学习从噪声到图片的映射。常见的模型架构包括U-Net、VAE等。这些模型通常由编码器和解码器组成：

编码器：编码器将输入的噪声逐步转换为更复杂的表示。
解码器：解码器则将编码器的输出逐步解码为最终的图片

三、训练过程

为了训练PyTorch Diffusion Model，需要准备一个数据集，其中包含大量真实图片和对应的噪声图片。噪声图片可以通过对真实图片添加高斯噪声来生成。数据集应该分为训练集、验证集和测试集。

在训练过程中，通过反向传播和优化器来更新模型的权重，使得模型能够从噪声图片生成真实的图片。训练过程中可以使用不同的损失函数，如重建损失、KL散度等来度量生成的图片与真实图片之间的差异。

四、应用与优化

PyTorch Diffusion Model在图像生成领域具有广泛的应用前景，如图像修复、超分辨率、风格迁移等。为了提高模型的性能和效率，可以进行以下优化：

参数调整：包括学习率、批量大小等关键参数的调整，以获得更好的收敛效果。
内存管理：通过优化内存使用，减少内存消耗，提高训练速度。
计算加速：利用GPU进行并行计算，可以显著提高模型训练和推理的速度。
混合精度训练：使用不同精度数据类型进行训练，减少内存消耗和计算时间。

简介
Text- to -image 简介

一简介

1.1 Diffusion Model 生成图片过程

这个过程叫做 Reverse Process

1 随机生成一张符合高斯分布的噪声图片1

2 把图片1输入Denoise 模型去除噪声,得到图片2

3 把图片2输入Denoise 模型去除噪声,输出图片3

4 依次迭代,不断的Denoise,最后生成图片

1.2 Denoise Model

输入：

图片X + step(噪声的严重程度)

内部架构

首先通过Noise Predicter 预测出噪声图片N,然后把输入图片X减去噪声图片N

得到输出

1.3 Noise Predicter 模块

1.3.1 问题：
Noise Predicter 模型如何得到训练的数据集

1.3.2 解决方法:
Forward Process or Diffusion Process

原始图片 $X^1$ ：

step1: 随机采样了噪声 $N^1$ , 输出 $X^2=X^1+N^1$

step2：随机采样了噪声 $N^2$ , 输出 $X^3=X^2+N^2$

Step3: 随机采样了噪声 $N^3$ , 输出 $X^4=X^3+N^3$

依次类推，得到对应的训练集

二 Text to Image

文字如何生成图片

2.1 数据集

ImageNet LAION

2.1 Denoise 流程

输入：

文字，step，图片

输出：

迭代输出图片

2.2 Denoise 模型

2.3 算法

Diffusion Model：比“GAN"还要牛逼的图像生成模型！论文精读+公式推导，迪哥2小时带你吃透扩散模型！_哔哩哔哩_bilibili

论文研读之Diffusion+Transformer时序生成：用于一般时序生成的可解释扩散模型_哔哩哔哩_bilibili 扩散模型 - Diffusion Model【李宏毅2023】_哔哩哔哩_bilibili

【斯坦福吴恩达】2024公认的最好的扩散模型原理课程-How Diffusion Models Work~_哔哩哔哩_bilibili

原文地址：https://blog.csdn.net/chengxf2/article/details/143776066

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：精品可编辑PPT | 信息化发展规划之IT治理优化
下一篇：云原生开发框架

掌握 Vue key：剖析其原理及与无 key 的区别
keykey的作用：确保 Vue 高效更新列表，避免不必要的 DOM 操作，提高性能。设置key和不设置key的区别：有key时，Vue 可以准确地追踪每个元素的身份，避免错误的元素复用；没有key时
阅读更多2024-11-26
MySQL底层概述—2.InnoDB磁盘结构
当日志文件达到该阈值后，且参数innodb_undo_log_truncate=ON时，才会触发truncate回收动作，被truncate后的表空间文件大小，会缩小到undo log表空间数据文件默
阅读更多2024-11-26
JS的DOM操作和事件监听综合练习（具备三种功能的轮播图案例）
第4张</p><p class="button" id="p4">第4张</p><p class="but
阅读更多2024-11-26
vue3 ts项目 | 使用TDesign的日期选择组件
除此之外，也可以使用和来实现自动导入：您仍需在项目引入组件库的少量全局样式变量并安装两个unplugin相关的第三方包然后在 Vite 对应的配置文件添加上述插件。
阅读更多2024-11-26
rpm方式安装postgres数据库及普通用户管理数据库
postgres安装及普通用户管理
阅读更多2024-11-26
MySQL数据库与Informix：能否创建同名表？
在MySQL和Informix数据库中，创建同名表的需求可以通过不同的方式实现。MySQL不允许在同一个数据库下创建两个名称完全相同的表，但可以通过视图、别名或在不同数据库中创建表等方式来实现类似的效
阅读更多2024-11-26
Ansible--自动化运维工具
Ansible是一款自动化运维工具，基于Python开发，集合了众多运维工具（puppet、cfengine、chef、func、fabric）的优点，实现了批量系统配置、批量程序部署、批量运行命令等
阅读更多2024-11-26
【Electron学习笔记（二）】基于Electron开发应用程序
本文旨在帮助初学者快速上手Electron，通过一步步的示例操作，展示如何从头开始创建一个简单的本地应用程序。我们将从项目的基本结构搭建开始，包括创建HTML、CSS和JavaScript文件，到配置
阅读更多2024-11-26
Ansible Playbook剧本用法
Ansible Playbook剧本用法
阅读更多2024-11-26
自动化立体仓库堆垛机货叉故障处理
这个之前也有遇到过，所以我就明白了，应该就是前面的维修没搞定变频器的故障问题，所以就把它短接了，短接以后就不报警了，他就可以说修好了，顺利拿钱，而实际上这个变频器是一直有问题的，只是给短接没报故障，所
阅读更多2024-11-26

【PyTorch][chapter 228][李宏毅深度学习][Diffusion Model-1]

一、模型原理

二、模型架构

三、训练过程

四、应用与优化

相关文章