GAN如何使用的 Jensen-Shannon 散度

🕗 发布于 2024-09-21 00:19 生成对抗网络 机器学习 人工智能

GAN 在其原始形式中使用 Jensen-Shannon 散度（JS 散度） 来衡量生成器生成的分布与真实数据分布之间的差异。这是在 GAN 的对抗性损失函数设计中自然而然出现的。具体来说，GAN 的目标是让生成器 $G$ 生成的分布 $P_g$ 尽可能接近真实数据分布 $P_r$ ，判别器 $D$ 则尝试区分生成样本和真实样本。

在原始 GAN 中，GAN 的目标可以通过以下的 min-max 博弈来描述：

$\min_G \max_D V(D, G) = \mathbb{E}_{x \sim P_r}[\log D(x)] + \mathbb{E}_{z \sim P_z}[\log (1 - D(G(z)))]$

判别器损失和生成器损失的推导

判别器 $D$ 的目标是最大化上述损失函数，它希望将真实样本 $x$ 分类为真实 ( $\approx 1$ )，将生成样本 $G (z)$ 分类为假 ( $\approx 0$ )。
生成器 $G$ 的目标是最小化该损失函数，使得 $\approx 1$ ，也就是让判别器尽可能无法区分生成样本与真实样本。

在理论上，当判别器 $D$ 最优时，它可以表达为：

$D^*(x) = \frac{P_r(x)}{P_r(x) + P_g(x)}$

此时，生成器和判别器的损失函数 $V(D^*, G)$ 就可以被表达为 Jensen-Shannon 散度，即：

$V(D^*, G) = 2 \cdot \text{JS}(P_r \| P_g) - \log 4$

其中，JS 散度用来衡量两个分布 $P_r$ 和 $P_g$ 的相似性。当 $P_r = P_g$ 时，JS 散度为 0，表示两个分布完全相同；当两个分布几乎没有重叠时，JS 散度达到其最大值。

JS 散度在 GAN 中的作用

JS 散度作为一种对称的概率分布差异度量方法，在 GAN 中自然地出现，用来衡量生成器生成的分布与真实分布之间的差距。然而，原始 GAN 使用 JS 散度存在一些问题：

梯度消失：当生成器和真实分布之间的重叠很小时，JS 散度可能不提供有效的梯度信息，导致训练过程中生成器无法得到足够的反馈来改进样本生成质量。
训练不稳定：由于 JS 散度在生成器和真实分布差异较大时的非连续性，这使得 GAN 的训练变得不稳定，容易出现震荡或发散的现象。

总结

GAN 使用 Jensen-Shannon 散度 来衡量生成分布 $P_g$ 和真实数据分布 $P_r$ 的差异，这是原始 GAN 损失函数的核心。
然而，由于 JS 散度的梯度消失问题和训练不稳定性，后来如 WGAN（Wasserstein GAN）通过 Wasserstein 距离代替了 JS 散度，解决了这些问题。

原文地址：https://blog.csdn.net/qq_39698985/article/details/142315272

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：leetcode 345.翻转字符串中的元音字母
下一篇：【数据结构初阶】顺序结构二叉树（堆）接口实现超详解

[CUDA] cuda kernel开发记录
包括kernel的一些使用注意事项， launch_bound, __device__, debug排查技巧
阅读更多2024-11-16
【python】掌握 Flask：轻量级 Web 开发框架解析
路由是 Web 开发的基础，负责管理 URL 到视图函数的映射。在 Flask 中，路由定义非常简单，只需使用装饰器即可。这个代码段定义了一个路由，访问该路径时会返回 “Hello, Flask!通过
阅读更多2024-11-16
AI图片分析接口LiteAIServer摄像机实时接入分析平台未戴安全帽检测算法
随着人工智能技术的飞速发展，摄像机实时接入分析平台LiteAIServer工地未佩戴安全帽检测算法应运而生，为工地安全管理带来了革命性的变革。
阅读更多2024-11-16
2024新版pycharm如何切换anaconda虚拟环境
回归正题，导入项目后点击文件=>设置，找到解释器。不得不说这界面改的真不错，看着很舒服。另外在终端用指令切换也是可以的。添加解释器=>添加本地解释器。
阅读更多2024-11-16
计算机提示mfc140u.dll丢失的五种解决方法，了解mfc140u.dll错误的几种修复方法
当你尝试打开某些程序时，突然出现错误提示，告知你系统缺少 mfc140u.dll 文件，这可能让你感到困惑和无助。mfc140u.dll 是 Microsoft Foundation Class (M
阅读更多2024-11-16
k8s 中传递参数给docker容器
在 Kubernetes 中，可以通过多种方式将参数传递给 Dockerfile 或其运行的容器，常见的方式包括使用环境变量、命令行参数、配置文件等。
阅读更多2024-11-16
设计模式之工厂模式，但是宝可梦
作为一个细分了三个种类的设计模式，到底该如何取舍？比起直接new一个对象，使用对应模式的好处到底在哪？简单工厂模式：根据传入的参数决定产出的对象，可以隐藏一些创建的细节适用于需要根据条件创建不同对象的
阅读更多2024-11-16
【深度学习】wsl-ubuntu深度学习基本配置
这里注意一点，你换了源之后就最好不要开代理了，要不然搞不好下载失败，pip和conda都是。
阅读更多2024-11-16
nodejs和npm在gitbash中提示Not Found情况的解决办法
很多小伙伴学习了node以后，在cmd命令行中可以正常的获取node版本和npm版本，但是我们经常使用gitbash来管理git，这时候下载完gitbash后，在gitbash中输入node -v和n
阅读更多2024-11-16
判断子序列
给定一个长度为 n的整数序列 a1,a2,…,an以及一个长度为 m的整数序列 b1,b2,…,bm。请你判断 a序列是否为 b序列的子序列。子序列指序列的一部分项按原有次序排列而得的序列，例如序列
阅读更多2024-11-16

GAN如何使用的 Jensen-Shannon 散度

判别器损失和生成器损失的推导

JS 散度在 GAN 中的作用

总结

相关文章