VAE(与GAN)

🕗 发布于 2024-10-13 15:25 生成对抗网络 机器学习 人工智能

VAE

1. VAE 模型概述

变分自编码器（Variational Autoencoder, VAE）是一种生成模型，主要用于学习数据的潜在表示并生成新样本。它由两个主要部分组成：编码器和解码器。

编码器：将输入数据映射到潜在空间，输出潜在变量的均值（µ）和对数方差（log(σ²)）。
重参数化：从编码器输出的分布中采样，以便进行反向传播。
解码器：将潜在变量映射回数据空间，生成新的样本。

2. VAE 模型结构图

        +---------------------+
        |     Input Data     |
        +---------------------+
                  |
                  v
        +---------------------+
        |      Encoder        |
        |  (Neural Network)   |
        +---------------------+
                  |
                  v
         +-------------------+
         |    Mean (µ)      |
         +-------------------+
                  |
                  |         +-------------------+
                  |---------|  Log Variance     |
                  |         +-------------------+
                  |
                  v
         +-------------------+
         |   Reparameterize   |
         +-------------------+
                  |
                  v
        +---------------------+
        |      Latent Space   |
        +---------------------+
                  |
                  v
        +---------------------+
        |      Decoder        |
        |  (Neural Network)   |
        +---------------------+
                  |
                  v
        +---------------------+
        |   Reconstructed Data |
        +---------------------+

3. 关键步骤

输入数据：例如图像或其他类型的数据。
编码：通过编码器将输入转换为潜在空间的均值和对数方差。
重参数化：通过均值和方差，生成潜在变量，确保梯度可以传递。
解码：使用潜在变量生成重构的数据。

4. 损失函数

VAE 的损失函数由两部分组成：

重构损失：衡量输入和重构数据之间的差异，例如使用二元交叉熵。
Kullback-Leibler 散度：衡量潜在分布与标准正态分布之间的差异。

5. 应用场景

图像生成
数据降维
半监督学习

6. 生成示例

使用 VAE 可以生成新的、类似于训练数据的样本。例如，训练在 MNIST 数据集上的 VAE 可以生成手写数字图像。

总结

VAE 是一种强大的工具，通过有效地学习数据的潜在表示，使得生成新样本变得可行。它结合了深度学习和概率图模型的优点。

GAN和VAE

使用生成对抗网络（GAN）同样可以生成类似于训练数据的样本，比如手写数字图像。虽然 VAE 和 GAN 都是生成模型，用于生成新的数据样本，但它们在结构、训练方法和生成机制上有一些重要区别。

1. 结构

VAE：
- 包含两个主要部分：编码器和解码器。
- 编码器将输入映射到潜在空间，输出均值和方差。
- 从潜在空间中采样后，解码器生成重构数据。
GAN：
- 包含两个主要部分：生成器和判别器。
- 生成器从随机噪声中生成样本。
- 判别器判断样本是真实的还是生成的，生成器的目标是欺骗判别器。

2. 训练方法

VAE：
- 使用变分推断，通过最小化重构损失和 Kullback-Leibler 散度来优化模型。
- 损失函数可分解为两部分，确保生成的数据与真实数据相似，同时潜在空间遵循标准正态分布。
GAN：
- 采用对抗训练的方式，通过生成器和判别器之间的博弈进行优化。
- 生成器试图最大化判别器的错误率，而判别器则试图最小化错误率。

3. 生成机制

VAE：
- 生成过程是通过潜在空间的均值和方差进行采样，具有一定的随机性。
- 生成的样本通常更平滑，但可能缺乏细节。
GAN：
- 生成过程基于给定的随机噪声，生成的样本通常质量较高且细节丰富。
- GAN 可能会出现模式崩溃（mode collapse），即生成的样本多样性不足。

4. 应用场景

VAE：适用于需要控制潜在空间表示的任务，如特征学习和数据插值。
GAN：适用于需要高保真生成结果的任务，如图像生成和图像转换。

总结

总的来说，VAE 和 GAN 都各有优缺点，选择哪个模型取决于具体的应用需求和目标。VAE 更适合需要稳健性和简单性的方法，而 GAN 则在生成高质量、细节丰富的样本方面表现更好。

原文地址：https://blog.csdn.net/qq_46143063/article/details/142796086

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：闭着眼学机器学习——朴素贝叶斯分类
下一篇：Vue3 props

一文了解如何应对生成式AI和大模型应用带来的存储挑战
技术的发展正在推动着存储技术的变革，随着QLC、CXL和HBM等先进技术的不断突破和发展，生成式AI和大模型应用面临的存储墙问题将迎刃而解！生成式AI和各种大模型应用，对算力提出了更高的要求，CPU+
阅读更多2024-10-15
Excel：vba实现合并工作簿中的表
A、B、C这三个工作簿的数据都在sheet1，表头一样。
阅读更多2024-10-15
增强对象智能：谷歌开源的XR-Objects项目简介
根据用途的不同，整个系统被划分为四大主要类别：信息查询、对比分析、内容分享以及注释添加。每个类别之下又有多种具体的功能可供选择。总之，通过结合最新的计算机视觉技术和人工智能算法，谷歌成功打造出了一个极
阅读更多2024-10-15
MambaVision原理和源码调测
后面可以看到代码实现也是按照N/2写的。
阅读更多2024-10-15
Bluetooth Channel Sounding中关于CS Step及Phase Based Ranging相应Mode介绍
支持BLE CS的设备，必须要支持此模式，主要用于测量获得BLE CS双方的存在频率偏差。具体来说，是BLS CS中的initiator设备用此模式获得reflector设备与自身的频率偏差。获得该频
阅读更多2024-10-15
速卖通商品详情接口技术解析及Python代码示例
速卖通（AliExpress）作为全球知名的跨境电商平台，其开放平台提供了丰富的API接口，允许开发者集成速卖通的各项功能，实现商品搜索、详情查询、订单管理等一系列操作。本文将重点介绍如何使用速卖通商
阅读更多2024-10-15
【Kubernets】容器网络基础二：通讲CNI（Container Network Interface）容器网络接口实现方案
Macvlan和Ipvlan都是强大的 Linux 内核特性，能够为容器和虚拟机提供高效的网络连接。选择哪种技术取决于具体的网络需求和应用场景。如果你需要每个虚拟网络接口有独立的 MAC 地址，可以选
阅读更多2024-10-15
数据结构：双向带头链表
双向带头链表简易代码
阅读更多2024-10-15
Spring webflux
WebFlux的确通过线程池和多路复用的方式来处理请求，避免了传统每个请求都创建新线程的做法。虽然维护的线程数量是固定的，但由于采用了非阻塞和异步事件驱动的机制，线程并不会因为等待 I/O 而被阻塞，
阅读更多2024-10-15
Python 中 NameError 全局名称未定义
NameError: name 'x' is not defined 是 Python 中常见的错误之一，通常表示你尝试访问一个尚未定义的变量或函数。特别是全局名称未定义时，意味着你在使用某个
阅读更多2024-10-15