基于Matlab GUI的说话人识别测试平台

🕗 发布于 2024-11-06 08:21 matlab 计算机视觉 开发语言

基于Matlab GUI的说话人识别测试平台

摘要：为了克服在Matlab中语音处理工具箱的不足，设计出基于Matlab图形用户界面（GUI）的说话人识别测试平台。系统框架设计：特征参数采用美尔倒谱系数及差分美尔倒谱系数，识别模型采用矢量量化模型；人机交互实现：设置各控件属性，通过回调函数实现系统功能；测试实例：测试人数50人，识别率为96%，表明了该测试平台的有效性。该平台的特点是：功能较为完整，可设置参数，如：人数、字数、帧长等，方便用户实验，具有良好的实用性、可交互性等。

关键词： Matlab图形用户界面；说话人识别；测试平台；回调函数

0 引言

说话人识别（Speaker Recognition，SR）是语音识别的一种，是通过话音区分说话人，从而进行身份鉴别与认证的技术。与其他生物认证技术如指纹识别、掌型识别、虹膜识别等相比，具有独特的方便性、经济性和准确性，并逐渐成为人们日常生活和工作中重要且普及的安全验证方式[1]。

Matlab是使用最为广泛的科学计算软件之一，在说话人识别中有着广泛应用。但在实际应用中仍存在如下不足：其语音处理工具箱仅仅提供了基本函数，并未针对一类问题给出一整套设计方案；一般Matlab控制台程序以命令形式调用语音处理工具箱函数，这种形式不像人机交互界面那样直观，也不易数据处理。正因为这些困难与不足，有必要设计基于Matlab GUI的说话人识别测试平台[2]。

1 GUI说话人识别测试平台实现

1.1 系统框架设计

说话人识别系统框图如图1所示，主要由以下模块组成：

（1）预处理模块：完成对语音信号的采样与量化、预加重处理、加窗、端点检测等；

（2）特征提取模块：测试音和训练音都必须经特征提取，提取出表征说话人个性的语音信号特征，以方便后续处理；

（3）参考模板模块：对模型参数进行估计和优化，建立说话人模型；

（4）模式匹配模块：测试音经特征提取，将提取出的特征参数和训练时产生的模型进行匹配，计算匹配距离；

（5）判决模块：根据匹配距离大小，依照某种相似性准则形成判决[3]。

对上面5个模块编写程序，在程序中调用了语音处理工具箱中的enframe，melcepst，melbankm等函数[4]。对所有程序进行优化和整合，设计出说话人识别系统测试平台。

1.2 人机交互界面设计

说话人识别测试平台主界面如图2所示。设置各控件属性，通过回调函数实现系统功能。

1.2.1 控件属性值设置

图2主界面中，包括如下控件类型：Static Text，Push Button，Pop⁃up menu，Radio⁃button，Extid text，Mpanel等。表1为各控件类型的主要属性设置情况[5]。

1.2.2 系统各部分功能的实现

主界面主要包括录音、测试及结果分析3部分。

（1）录音部分：首先设置语音采样点数，然后录音，可通过PLOT按钮观看录制的语音波形，或通过PLAY按钮听录制语音的声音[6]，以保证录制语音质量。录音按钮回调函数为：

function pushbutton9_Callback（hObject， eventdata， handles）

（2）测试部分：首先选择人数、发音的字数、帧长、帧移、是否选择有端点检测，然后选择采用的语音特征参数是MFCC或MFCC+ΔMFCC，通过The Path of Train 按钮，输入训练语音路径，以输入训练语音，再按TRAIN按钮，当Edit text框中显示training has been completed表明训练已完成。再按The Path Of Test按钮，输入测试语音路径，以输入测试语音，再按TEST按钮以进行测试，其测试结果显示在Edit text框中，最后识别率显示在Identify rate窗口。训练按钮回调函数为：

function train_Callback（hObject， eventdata， handles）

（3）结果分析部分：对几个影响识别率的因素进行了分析。主要因素有：帧长、人数、字数、MFCC阶数、是否采用端点检测等，其结果和理论结论一致。

表1 控件类型的主要属性设置

2 测试实例

测试实例参数设置及测试结果如图3所示。特征参数采用MFCC+差分MFCC；识别模型为矢量量化模型；测试环境为实验室环境。人数为50人，每个人训练、测试时分别说12个汉字，中文普通话。识别率窗口显示系统识别率为96%，效果较好，表明了该测试平台的有效性。

3 结语

本文所设计的基于Matlab GUI说话人识别测试平台，充分利用Matlab软件中的GUI技术及语音处理工具箱中内置函数，功能完善，包括录音、测试及结果分析部分。该平台提供了良好的人机交互环境，便于用户在各种参数条件下的测试实验，例如用户可方便设置采样点数、人数、字数、及帧长、帧移、MFCC的阶数等测试条件，系统识别率高，为进一步开发说话人识别系统提供一定的仿真环境及参考价值。

参考文献

[1] 吴朝晖.说话人识别模型与方法[M].北京：清华大学出版社，2009.

[2] 秦辉.基于Matlab GUI的预测控制仿真平台设计[J].系统仿真学报，2006，18（10）：2778⁃2779.

[3] 甄斌，吴玺宏，刘志敏.语音识别和说话人识别中各倒谱分量的相对重要性[J].北京大学学报：自然科学版，2001，37（3）：371⁃378.

[4] 陈炜杰.噪声环境下的说话人识别技术研究[D].杭州：浙江工业大学，2008.

[5] 郑阿奇.Matlab实用教程[M].北京：电子工业出版社，2005.

[6] 徐明远，刘增力.Matlab仿真在信号处理中的应用[M].西安：西安电子科技大学出版社，2007.

原文地址：https://blog.csdn.net/2401_84149290/article/details/143428867

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：centos 6 yum安装 rabbitmq
下一篇：西南科技大学C++作业1——组合依赖关系实验代码

【信号处理】使用CNN对RF调制信号进行分类
Using CNN to classify RF modulation data.Dataset is from: DATA LINKpaper: Over the Air Deep Learning
阅读更多2024-11-08
MYSQL学习笔记（二）--认识索引、使用索引、索引失效
索引（index）是帮助MySQL高效获取数据的数据结构(有序)。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级
阅读更多2024-11-08
SpringCloud Sentinel 服务治理详解
这篇文章，根据这篇文章流控规则可以完美的实现效果，但是其他的授权规则、系统规则小编试了好像业务并不生效，主要是格式的问题，有兴趣的可以自行研究一下，另外一种办法就是自己写业务逻辑实现Nacos规则拉取
阅读更多2024-11-08
ffmpeg 视频滤镜：屏蔽边框杂色- fillborders
fillborders滤镜有几种方式帮你屏蔽边框的杂色、不好的图案。可以看到图片的上边和下边有黄色的杂色。设置fixed模式的填充颜色。设置fade模式的填充颜色。
阅读更多2024-11-08
使用 FFmpeg 进行音视频转换的相关命令行参数解释
FFmpeg 是一个强大的多媒体框架，能够解码、编码、转码、录制、播放以及流化几乎所有类型的音频和视频。目前有很多音视频或播放器都是基于 FFmpeg 开发的，如果你想快速且批量的处理音频或视频，这里
阅读更多2024-11-08
JVM垃圾回收详解
当垃圾回收器准备回收一个对象时，如果发现它还有虚引用，就会在回收对象的内存之前，把这个虚引用加入到与之关联的引用队列中。在垃圾回收器线程扫描它所管辖的内存区域的过程中，一旦发现了只具有弱引用的对象，不
阅读更多2024-11-08
CSRA2的LINUX操作系统24年11月2日上午上课笔记
local：他会将linux中的所有文件的路径信息保存到数据库中，在数据库中查找文件。# find . -type f # 查找当前目录下所有文件类型是普通文件的文件。# nc:n字节 nk:
阅读更多2024-11-08
阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源，实现 MySQL 整库实时同步
以上即为将 MySQL 整库实时同步至 SelectDB Cloud 的具体操作步骤。通过使用 Dataworks，您能够高效地将 MySQL 数据库同步至 SelectDB Enterprise、S
阅读更多2024-11-08
基于SSM（Spring + Spring MVC + MyBatis）框架的快递管理系统
用户管理：管理员可以添加、删除、修改和查询用户信息。快递员管理：记录快递员信息，如姓名、联系方式、所属区域等。客户管理：记录客户信息，如姓名、联系方式、地址等。包裹管理：支持对包裹信息的增删改查操作，
阅读更多2024-11-08
OpenCV自学系列（1）——简介和GUI特征操作
对应第一章#简单介绍基于OpenCV-python的官方文档进行opencv自学##其原文为可见，即使OpenCV版本已经4.x，但官方给出的教程还是3.x,此教程还是以最新版4.10做学习。##环境
阅读更多2024-11-08

基于Matlab GUI的说话人识别测试平台

相关文章