【深度学习】自编码器（Autoencoder, AE）

🕗 发布于 2025-01-16 10:08 深度学习 机器学习 人工智能 自编码器神经网络

自编码器（Autoencoder, AE）是一种无监督学习模型，主要用于特征提取、数据降维、去噪和生成模型等任务。它的核心思想是通过将输入压缩到一个低维的潜在空间表示（编码过程），然后再从这个潜在表示重构输入（解码过程），从而使得模型能够学习数据的内在结构。

自编码器的基本结构

自编码器通常由两个部分组成：

编码器（Encoder）
- 将高维输入数据映射到低维的潜在表示空间。
- 通常用一个或多个全连接层（或卷积层）实现，激活函数常用ReLU或其他非线性函数。
解码器（Decoder）
- 将潜在表示重新映射到原始输入空间，试图重建输入。
- 结构通常对称于编码器，输出层的维度与输入层相同。

损失函数：
自编码器的目标是最小化输入与重构之间的误差，常用均方误差（MSE）作为损失函数：

其中，x为输入数据，x^为重构数据。

自编码器的种类

基本自编码器（Vanilla Autoencoder）最简单的形式，编码和解码均为全连接神经网络。
去噪自编码器（Denoising Autoencoder, DAE）在训练时对输入添加噪声，但目标是还原无噪声的原始输入，从而提高模型的鲁棒性。
稀疏自编码器（Sparse Autoencoder, SAE）通过在潜在表示中添加稀疏性约束（例如KL散度），使模型仅激活少量神经元，达到特征选择的效果。
变分自编码器（Variational Autoencoder, VAE）引入概率分布，将潜在表示建模为一个分布（如高斯分布），并通过最大化证据下界（ELBO）进行优化。
卷积自编码器（Convolutional Autoencoder, CAE）适用于图像数据，用卷积层和池化层代替全连接层进行编码和解码。
条件自编码器（Conditional Autoencoder, CAE）在编码过程中引入条件信息（如类别标签）以进行有条件的生成或特征提取。
对抗自编码器（Adversarial Autoencoder, AAE）结合生成对抗网络（GAN）的思想，通过对潜在空间分布施加对抗性约束，得到更好的分布表示。

自编码器的应用

数据降维
自编码器可以作为一种非线性降维工具，与PCA类似，但更灵活。
去噪
去噪自编码器可以从带噪数据中恢复原始数据，应用于信号处理、图像处理等领域。
异常检测
使用重构误差作为检测指标，大的重构误差通常表明输入是异常数据。
生成模型
变分自编码器和对抗自编码器可以生成逼真的新数据。
特征学习
自编码器的潜在表示可以作为输入的紧凑特征，用于下游任务（如分类或回归）。
图像处理
卷积自编码器被广泛应用于图像压缩、去模糊和超分辨率等任务。

实现示例（PyTorch）:用PyTorch构建一个基本的自编码器，并对图像数据（如MNIST）进行重构任务。

import torch
import torch.nn as nn
import torch.optim as optim

# 定义自编码器模型
class Autoencoder(nn.Module):
    def __init__(self):
        super(Autoencoder, self).__init__()
        # 编码器
        self.encoder = nn.Sequential(
            nn.Linear(784, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 32)
        )
        # 解码器
        self.decoder = nn.Sequential(
            nn.Linear(32, 64),
            nn.ReLU(),
            nn.Linear(64, 128),
            nn.ReLU(),
            nn.Linear(128, 784),
            nn.Sigmoid()  # 将输出值压缩到[0,1]范围
        )

    def forward(self, x):
        x = self.encoder(x)
        x = self.decoder(x)
        return x

# 创建模型
model = Autoencoder()
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 模拟训练
for epoch in range(10):
    for data in dataloader:  # 假设dataloader已定义并提供批量输入
        inputs = data.view(-1, 784)  # 将输入展平
        outputs = model(inputs)
        loss = criterion(outputs, inputs)  # 计算重构误差

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

    print(f"Epoch [{epoch+1}/10], Loss: {loss.item():.4f}")

原文地址：https://blog.csdn.net/dundunmm/article/details/145170086

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基础IO -- 软硬链接
下一篇：【gin】模型绑定、参数验证及文件上传go案例演示

集成Sleuth实现链路追踪
【代码】集成Sleuth实现链路追踪。
阅读更多2025-01-24
Nuxt：利用public-ip这个npm包来获取公网IP
Nuxt：利用public-ip这个npm包来获取公网IP
阅读更多2025-01-24
【Linux】文件操作、系统IO相关操作、inode和输入输出重定向
文件在磁盘里，磁盘是永久性存储介质，因此文件在磁盘上的存储是永久性的，磁盘是外设（即是输出设备也是输入设备），对磁盘上所有文件的操作本质都是对外设的输入和输出，简称IO
阅读更多2025-01-24
10个非常基础的 Javascript 问题
根据MDN，JavaScript（通常缩写为JS）是一种轻量级的，解释性的，面向对象的语言，具有一流的功能，并且最著名的是Web页面的脚本语言，但它也用于许多非浏览器环境中。所有声明（函数，var，l
阅读更多2025-01-24
分布式与微服务：构建现代应用的关键架构
分布式系统和微服务架构是现代计算机系统的重要组成部分，它们为构建高可用、高可扩展和高性能的应用提供了强大的解决方案。通过上述 Java 示例，我们展示了不同场景下的实现方式，并深入探讨了其底层原理、性
阅读更多2025-01-24
青少年CTF练习平台 PHP的后门
根据提示，PHP/8.1.0-dev漏洞，修改请求头利用此漏洞。注意 zerodium后面拼接函数发送。
阅读更多2025-01-24
mock可视化&生成前端代码
介绍：mock是我们前后端分离的必要一环、ts、axios编写起来也很麻烦。我们就可以使用以下插件，来解决我们的问题。目前支持vite和webpack。欢迎小伙伴们提issues、我们共建。提升我们的
阅读更多2025-01-24
科比断腱之战所穿球鞋将被拍卖预计成交价会超过60万美元
虽然他在篮球运动方面有着得天独厚的天赋，但真正让他在竞争中脱颖而出的是他每天都坚持不懈地让自己变得更好。这双比赛穿的球鞋体现了他非凡的毅力，正是这种毅力使他成为史上最伟大的球员之一。在2013年4月1
阅读更多2025-01-24
分布式光纤应变监测是一种高精度、分布式的监测技术
主体结构应变监测：在高层建筑的混凝土柱、核心筒、梁等主要承重结构中安装分布式光纤应变传感器，能够实时监测建筑物在自身重力、风荷载、地震作用下的应变状态。例如，在高层建筑受到强风时，建筑物的迎风面和背风
阅读更多2025-01-24
30、Java中的异常(Exception)
自定义异常是开发者根据特定需求创建的异常类，它们通常继承自 Java 的 Exception 类或 RuntimeException 类。自定义异常使得异常处理更加灵活和具体，能够更好地描述程序中可能
阅读更多2025-01-24

【深度学习】自编码器（Autoencoder, AE）

自编码器的基本结构

自编码器的种类

自编码器的应用

实现示例（PyTorch）:用PyTorch构建一个基本的自编码器，并对图像数据（如MNIST）进行重构任务。

相关文章