自学内容网 自学内容网

ctc(Connectionist Temporal Classification) 学习

        CTC实际上解决了一个问题,狭义的讲,怎么确定一个语音识别网络输出的音素串是否对应一个单词。这个在利用损失函数进行优化的时候是必要的。

        一个单词的说法是很多的,有的部分发音长,有的部分发音短,因此一个单词的音素序列是很多的,不确定的,不可能直接用枚举的方式判断音素串是否对应一个单词。       

        CTC对序列整体进行建模,计算一个音素序列对应当前单词的概率。

        以heeϵlϵlloo 为例,判断heeϵlϵlloo音素序列是hello的概率。考虑一个整体比较麻烦,可以考虑把一个序列拆分成一个一个基本单元来分析。可以考虑用动态规划的方法。这里用递归的思路来分析。

        首先用P(heeϵlϵlloo|hello)表示heeϵlϵlloo对应hello的概率,考虑到连续音素可以匹配一个字符,P(heeϵlϵlloo)可以拆分成P(hellϵlϵllo|hello)P(o|o)+P(hellϵlϵllo|hell)P(o|o),然后P(hellϵlϵllo|hello)又可以拆分P(hellϵlϵll|hello)P(o|o)+P(hellϵlϵll|hell)P(o|o),然后不断拆分下去。最后会拆分成每个输出的音素的对应某个字符的概率。某个音素是某个字符的概率就是NN输出的softmax概率。

        
https://distill.pub/2017/ctc/icon-default.png?t=N7T8https://distill.pub/2017/ctc/

https://zhuanlan.zhihu.com/p/40170325icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/40170325连接时序分类 Connectionist Temporal Classification (CTC)_connectionist temporal classification-CSDN博客文章浏览阅读1.6k次,点赞12次,收藏11次。CTC全称Connectionist temporal classification,是一种常用在语音识别、文本识别等领域的算法,用来解决输入和输出序列长度不一、无法对齐的问题。在CRNN中,它实际上就是模型对应的损失函数(CTC loss)。_connectionist temporal classificationhttps://blog.csdn.net/m0_64768308/article/details/136494825华为开发者论坛icon-default.png?t=N7T8https://developer.huawei.com/consumer/cn/forum/topic/0201784250928720072CTC(Connectionist Temporal Classification)介绍_connectionist temporal classification (ctc)-CSDN博客文章浏览阅读1.7k次。CTC解决什么问题CTC,Connectionist Temporal Classification,用来解决输入序列和输出序列难以一一对应的问题。举例来说,在语音识别中,我们希望音频中的音素和翻译后的字符可以一一对应,这是训练时一个很天然的想法。但是要对齐是一件很困难的事,如下图所示(图源见参考资料[1]),有人说话块,有人说话慢,每个人说话快慢不同,不可能手动地对音素和字符对齐,这样太......_connectionist temporal classification (ctc)https://blog.csdn.net/weixin_36670529/article/details/102885071        Graves A, Fernández S, Gomez F, et al. Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks[C]//Proceedings of the 23rd international conference on Machine learning. 2006: 369-376.

 


原文地址:https://blog.csdn.net/j99999999955555/article/details/140670126

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!