深度学习中的结构化概率模型 - 学习依赖性的关系篇

🕗 发布于 2024-10-08 23:56 深度学习 人工智能 算法 机器学习

序言

在深度学习的探索之旅中，结构化概率模型以其独特的能力，在学习数据间复杂依赖关系方面展现出非凡的潜力。传统模型往往难以有效捕捉变量间错综复杂的相互作用，而结构化概率模型则通过引入结构化的先验知识，使得模型能够深入理解并建模这些依赖关系。这种能力对于处理现实世界中的复杂问题至关重要，如自然语言中的语义关联、图像中的空间布局、以及时间序列数据中的动态变化等。通过结构化建模，深度学习系统能够更准确地理解数据背后的规律，从而做出更加精准和可靠的预测与决策。

学习依赖性的关系

良好的生成模型需要准确地捕获所观察到的或 ‘‘可见’’ 变量 $\textbf{v}$ 上的分布。
- 通常 $\textbf{v}$ 的不同元素彼此高度依赖。
- 在深度学习中，最常用于建模这些依赖性关系的方法是引入几个潜在的或 ‘‘隐藏’’ 变量 $\textbf{h}$ 。
- 然后，该模型可以捕获任何对之间的依赖性关系（变量 $\text{v}_i$ 和 $\text{v}_j$ 间接依赖， $\text{v}_i$ 和 $\textbf{h}$ 之间直接依赖， $\textbf{v}$ 和 hj 直接依赖)。
一个好的不包含任何潜变量的关于 $\textbf{v}$ 的模型需要在贝叶斯网络中的每个节点具有大量父节点或在马尔可夫网络中具有非常大的团。
- 仅仅表示这些高阶的相互作用是昂贵的。
- 首先从计算角度上，存储在存储器中的参数数量是团中成员数量的指数级别。
- 接着在统计学意义上，因为这个指数数量的参数需要大量的数据来准确估计。
当模型旨在描述直接连接的可见变量之间的依赖性关系时，通常不可能连接所有变量，因此设计图模型时需要连接那些紧密相关的变量，并忽略其他变量之间的作用。
- 机器学习中有一个称为结构学习 ( $\text{structure learning}$ ) 的领域来专门讨论这个问题。
- $\text{Koller and Friedman (2009)}$ 是一个结构学习的好的参考资料。
- 大多数结构学习技术是基于一种贪婪搜索的形式。
- 它们提出了一种结构，对具有该结构的模型进行训练，然后给出分数。
- 该分数奖励训练集上的高精度并惩罚复杂的模型。
- 然后提出添加或移除少量边的候选结构作为搜索的下一步。
- 搜索向一个预计会增加分数的方向发展。
使用潜变量而不是自适应结构避免了离散搜索和多轮训练的需要。
- 可见变量和潜变量之间的固定结构可以使用可见单元和隐藏单元之间的直接作用，从而使得可见单元之间间接作用。
- 使用简单的参数学习技术，我们可以学习到一个具有固定结构的模型，这个模型在边缘分布 $p(\boldsymbol{v})$ 上拥有正确的结构。
潜变量还有一个额外的优势，即能够高效地描述 $p(\text{v})$ 。
- 新变量 $\textbf{h}$ 还提供了 $\textbf{v}$ 的替代表示。
- 例如，如应用数学与机器学习基础 - 概率与信息论篇 - 常用概率分布所示， $\text{GMM}$ 学习了一个潜变量，这个潜变量对应于输入样本是从哪一个混合体中抽出。
- 这意味着 $\text{GMM}$ 中的潜变量可以用于做分类。
- 在系列篇章：自编码器中，我们看到了简单的概率模型如稀疏编码是如何学习可以用作分类器输入特征或者作为流形上坐标的潜变量的。
- 其他模型也可以使用相同的方式，但是更深的模型和具有多种相互作用方式的模型可以获得更丰富的输入描述。
- 许多方法通过学习潜变量来完成特征学习。
- 通常，给定 $\textbf{v}$ 和 $\textbf{h}$ ，实验观察显示 $\mathbb{E}[\textbf{h} \mid \textbf{v}]$ 或 $\argmax_h p(\boldsymbol{h},\boldsymbol{v})$ 都是 $\boldsymbol{v}$ 的良好特征映射。

总结

综上所述，深度学习中的结构化概率模型在学习数据间依赖关系方面展现出了显著的优势。它们不仅能够捕捉变量间的直接依赖，还能通过结构化的方式揭示隐藏的、间接的以及非线性的关系。这种能力极大地增强了模型的表达能力和泛化能力，使得深度学习系统能够更好地适应复杂多变的数据环境。随着技术的不断进步，我们有理由相信，结构化概率模型将在更多领域发挥关键作用，推动人工智能技术的持续创新与发展。

往期内容回顾

应用数学与机器学习基础 - 概率与信息论篇

原文地址：https://blog.csdn.net/benny_zhou2004/article/details/142534395

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：职场中的人情世故，你懂了多少？
下一篇：mysql-索引

【LeetCode】动态规划—115. 不同的子序列（附完整Python/C++代码）
在字符串处理的领域，不同子序列问题是一个经典的挑战，涉及到如何计算一个字符串的所有不同子序列以匹配另一个字符串。通过动态规划方法，我们能够有效地找出字符串之间的匹配数量，为更复杂的字符串问题提供解决方
阅读更多2024-10-09
银河麒麟V10安装ToDesk远程控制
【代码】银河麒麟V10安装ToDesk远程控制。
阅读更多2024-10-09
分享几个国外SSL证书提供商网站
最重要的是，Comodo被认证为 SSL 证书的畅销产品。如果您的域下有多个服务器，Comodo允许您在所需的任意数量的服务器上使用相同的SSL证书。通过快速简单的验证流程，您可以专注于网站的其他方面
阅读更多2024-10-09
20.Nginx动静分离原理与案例实现
Nginx动静分离原理与案例实现
阅读更多2024-10-09
【C++ 11】nullptr 空指针
【代码】【C++ 11】nullptr 空指针。
阅读更多2024-10-09
D开头的词根词缀:dem+di+de+dys+dia+dis
人民－（２）dem(o)democracy[demo人民，cracy统治；"人民统治"→人民做主→]民主；民主政治，民主政体；民主主义democrat[见上，crat主张…统治的人
阅读更多2024-10-09
ES postman操作全量修改，局部修改，删除
上图是只修改id 为1001数据的title为华为手机。只修改指定的需求的内容的请求方式。修改需要调用的url 地址是。删除一个指定id的文档信息。执行请求之后提示已经删除了。post方式就是局部修改
阅读更多2024-10-09
【C#生态园】提升C#图像处理与压缩效率：六款库全面比较
本文将介绍六个用于C#的图像处理和压缩库，分别是ImageProcessor、SixLabors.ImageSharp、ImageMagick、SkiaSharp、OpenCvSharp和Magick
阅读更多2024-10-09
客户端埋点SDK及其文档推荐
客户端埋点SDK及其文档推荐。
阅读更多2024-10-09
uniapp顶部提示栏实现
2.通过占位与fixed使显示内容位置固定。用途：用于展示较短系统通知。并给予文字显示滚动效果。3.设置显示效果与关闭。
阅读更多2024-10-09

深度学习中的结构化概率模型 - 学习依赖性的关系篇

序言

学习依赖性的关系

总结

往期内容回顾

相关文章