【机器学习】27. 马尔科夫链和隐马模型HMM

🕗 发布于 2024-11-08 03:03 机器学习 人工智能 学习

马尔科夫链和隐马模型HMM

1. Markov chain
2. 计算
3. Hidden Markov Model
4. 两个假设
5. 问题1：evaluation
6. Forward 算法
7. 问题2：Decoding
8. Viterbi算法
9. 问题3：Learning
10. 期望最大化算法Expectation Maximization

1. Markov chain

马尔可夫链是描述从一种状态到另一种状态的转换序列的模型，其中每种状态的概率仅取决于前一种状态
假设：
任何具体状态的概率只取决于之前的状态（不取决于更早的历史）。

在这里插入图片描述

2. 计算

3. Hidden Markov Model

马尔可夫模型在需要计算可直接观测状态的概率时很有用。

隐马尔可夫模型用于我们无法直接观察状态（它们是隐藏的），但我们可以根据间接信息对其进行判断的情况。

什么是隐藏的？天气
你能看到什么？衬衫夹克、连帽衫

λ = (π, A, A0)
π 是N个可能的隐藏状态
A是每个状态转换的概率矩阵
A0是每个状态的初始概率

4. 两个假设

齐次性假设: 即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于它在前一时刻的状态, 与其他时刻的状态和观测无关, 也与时刻t本身无关
观测独立性假设: 即假设任意时刻的观测值只依赖于该时刻的马尔可夫链的状态, 与其他观测及状态无关

5. 问题1：evaluation

给定一个λ = (π, A, A0)HMM模型和一个观测序列X = x1, x2, x3, …计算序列出现概率。
在这里插入图片描述
计算 X = shirt, Hoodie的概率
A中的每个概率都要计算X=shirt，Hoodie的概率

在9种组合里先计算Rainy,Cloudy
P(X, {Rainy, Cloudy})

初始状态是Rainy = 0.6
从Rainy 到 Cloudy = 0.3
观测概率
- 在Rainy的时候，Shirt的概率是0.8
- 在Cloudy的时候，Hoodie的概率是0.1

结果为0.6 * 0.3* 0.8*0.1 = 0.0144
计算9种组合相加，得到最终概率。
计算的复杂度为2TN^T。T是时间步长，N是状态个数

6. Forward 算法

直接案例理解
在这里插入图片描述

初始化：计算在t=1的时候，每个状态的前向概率
$f_k(1) = A_0(k)e_k(x_1)$
$f_{rainy}(1) = A_0(rainy)e_{rainy}(Shirt)= 0.6 * 0.8$
可以得到cloud和sunny的f（1）为0.15和0.001
迭代
$f_k(i) = e_k(x_i)\sum_j f_j(i-1)a_{jk}$
$f_{rainy}(2) = e_{rainy}(Hoodie)(f_{rainy}(1)a(rainy,rainy)+f_{cloudy}(1)a(cloudy,rainy)+f_{sunny}(1)a(sunny,rainy)) = 0.01*(0.48*0.6+0.15*0.4+0.001*0.1) = 0.0035$
3.最后一个步长就等于最后的所有f_k(i)相加，这里是f(2)的和，三个状态，就是cloud,sunny,rainy,各自一个f(2)

7. 问题2：Decoding

问题1是：给定一个λ = (π, A, A0)HMM模型和一个观测序列X = x1, x2, x3, …计算序列出现概率。
问题2是：给定一个λ = (π, A, A0)HMM模型和一个观测序列X = x1, x2, x3, …计算最可能的隐藏序列

8. Viterbi算法

在这里插入图片描述

初始化
计算每个状态的Viterbi分数
$V_k(1) = A_0(k)e_k(x_1)$

$V_{rainy}(1) = A_0(Rainy)e_{Rainy}(Shirt) = 0.6 *0.8 = 0.48$
同理得到cloud和sunny的v1为0.15，0.001
2.迭代
计算状态k在时间i的vierbi得分
$V_k(i) = e_k(x_i)max_jV_j(i-1)a_{jk}$
记录回溯路径
$Ptr_k(i) = argmax_jV_j(i-1)a_{jk}$
$V_{rainy}(2) = e_{rainy}(Hoodie) * max(V_{rainy}(1)a_{rainy,rainy}, V_{cloudy}(1)a_{cloudy,rainy},V_{sunny}(1)a_{sunny, rainy}) = 0.01 * max(0.48*0.6, 0.15*0.4, 0.001*0.1) = 0.0029$
Ptr的最大索引是rainy，1（假设）
3.终止
Ptr2是rainy
Ptr3 = argmax(V_k(2))，最大是Sunny
所以最终答案是Rainy，sunny

9. 问题3：Learning

问题1是：给定一个λ = (π, A, A0)HMM模型和一个观测序列X = x1, x2, x3, …计算序列出现概率。
问题2是：给定一个λ = (π, A, A0)HMM模型和一个观测序列X = x1, x2, x3, …计算最可能的隐藏序列
问题3是：给定一个一个观测序列X = x1, x2, x3, …找到λ = (π, A, A0)HMM模型

10. 期望最大化算法Expectation Maximization

λ = (π, A, A0) 随机初始化
计算每个状态下的概率分布
利用2中的概率更新λ = (π, A, A0)，使得给定预测数据的似然函数最大化，涉及预测最可能序列并于实际观测序列进行比较
如果模型更新后，p(x|λ)增加，就回第二步继续迭代，否则停止

原文地址：https://blog.csdn.net/weixin_48846514/article/details/143448692

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【反射率】-- Lab 转换(excel)
下一篇：网络,NAT地址转换,虚拟路由冗余协议VRRP

C语言实践:实现插入排序
实现插入排序。
阅读更多2024-11-08
Python爬虫 | 什么是反爬虫技术与机制
反爬虫技术与机制
阅读更多2024-11-08
OpenSSL 生成根证书、中间证书和网站证书
在这个过程中，需要根据提示输入国家、地区、组织名称等信息，例如国家填“CN”，地区填“Beijing”等，组织名称可自定义为“China Root CA Organization”等。同样输入相应信息
阅读更多2024-11-08
如何选择适合小团队的项目管理工具？免费与开源软件推荐
禅道禅道是一款专业的研发项目管理软件，集产品管理、项目管理、质量管理、文档管理、组织管理和事务管理于一体。它为 IT 企业或正在进行信息化的企业提供了一个一体化的集成管理工具。禅道的功能涵盖需求管理、
阅读更多2024-11-08
Windows安装配置node.js
访问，下载推荐使用长期支持版本，但是此次是学习用的，使用最新版本试一下。
阅读更多2024-11-08
C/C++ 跨平台引入 jemalloc 内存池分配管理的编译兼容性
在 Windows 平台上面，引入由VCPKG部署编译的 JEMALLOC 是无法调用 JE_MALLOC、JE_FREE 函数的，除非对库头文件进行魔改，一个好的办法是显示声明并导入函数签名。在其它
阅读更多2024-11-08
统信UOS开发环境支持Electron
全面支持Electron开发环境，同时还提供了丰富的开发工具和开发资源，进一步提升工作效率。
阅读更多2024-11-08
LSTM+LightGBM+Catboost的stacking融合模型
LSTM+LightGBM+Catboost的stacking融合模型
阅读更多2024-11-08
HTB：Nibbles[WriteUP]
可见文件index.html，直接使用浏览器对其进行访问，Ctrl+U查看源码。因为feroxbuster扫出来的东西太乱了，使用ffuf再次对。那就好办了，我们直接给它弄一个这文件出来直接getsh
阅读更多2024-11-08
计算机网络——SDN
分布式控制路由集中式控制路由
阅读更多2024-11-08