基于GRNN广义回归网络和MFCC的语音情绪识别matlab仿真,对比SVM和KNN

🕗 发布于 2024-10-17 09:31 回归数据挖掘 人工智能 GRNN 广义回归网络

1.算法运行效果图预览

2.算法运行软件版本

3.部分核心程序

4.算法理论概述

5.算法完整程序工程

1.算法运行效果图预览

(完整程序运行后无水印)

filePath =

'Test_data\悲伤1.wav'

类型：悲伤
识别置信度

Vmax =

0.9559

2.算法运行软件版本

matlab2022a

3.部分核心程序

（完整版代码包含详细中文注释和操作步骤视频）

..................................................................
Labsn   = [];
% 遍历每种情绪
for i = 1:length(Em_kind)
    Labs0 = Em_kind(i); % 当前情绪标签
    trainfile = dir(['train_data/' char(Labs0), '\*.wav']); % 获取当前情绪的所有 WAV 文件
    Num_wav = length(trainfile(not([trainfile.isdir]))); % 计算有效 WAV 文件的数量
    
    % 遍历每个 WAV 文件
    for j = 1:Num_wav
        [ywav, Fs] = audioread(['train_data/' char(Labs0) '/' char(lower(Labs0)) int2str(j) '.wav']); % 读取音频文件
        
        % 计算 MFCC 特征
        [Fmfcc, ~, ~, H] = func_MFCC(ywav, Fs, Lframe, LShift, Fpre, @hamming, [fre_min fre_max], Nch, Cep_coff + 1, Cep_Sine);
        
        % 将当前文件的 MFCC 特征添加到训练数据集中
        Dat_trainset = [Dat_trainset; Fmfcc'];
        
        % 将当前文件的标签添加到标签集中
        Labs = [Labs; repmat(cellstr(Labs0), size(Fmfcc, 2), 1)];
        Labsn= [Labsn;repmat(i, size(Fmfcc, 2), 1)];
    end
end

% 训练 KNN 模型
model1 = fitcknn(Dat_trainset, Labs); % 标准化数据并训练 KNN 模型

% 训练多类分类模型
model2 = fitcecoc(Dat_trainset, Labs); % 训练多类分类模型

%GRNN
model3 = newgrnn(Dat_trainset',Labsn',5);



% 保存模型
save model.mat model1 model2 model3; % 将模型保存到文件中
179

4.算法理论概述

语音情绪识别是人工智能和信号处理领域中的一个重要研究方向。它旨在通过分析语音信号中的特征，识别出说话人的情绪状态，如高兴、悲伤、愤怒、恐惧等。随着人工智能技术的不断发展，语音情绪识别在人机交互、心理健康监测、客户服务等领域具有广泛的应用前景。

梅尔频率尺度:

人耳对声音的感知不是线性的，而是在频率上呈现出一种非线性的关系。梅尔频率尺度是一种基于人耳听觉特性的频率尺度，它将频率转换为梅尔频率，使得人耳对不同频率的声音具有相似的感知。

MFCC 特征提取过程:

预加重：对输入的语音信号进行预加重处理，以增强高频部分的能量。预加重可以通过以下公式实现：，其中为输入的语音信号，为预加重后的信号，为预加重系数，通常取。

分帧：将语音信号分成若干个短时段，称为帧。每一帧的长度通常为 20-40ms，相邻帧之间有一定的重叠。

加窗：对每一帧信号进行加窗处理，以减少帧边界处的不连续性。常用的窗函数有汉明窗、汉宁窗等。

快速傅里叶变换（FFT）：对加窗后的每一帧信号进行快速傅里叶变换，得到其频谱。

计算梅尔滤波器组能量：将频谱通过一组梅尔滤波器组，得到每个滤波器的输出能量。梅尔滤波器组是一组在梅尔频率尺度上均匀分布的带通滤波器，其数量通常为 20-40 个。

对数运算：对每个滤波器的输出能量取对数，得到对数梅尔滤波器组能量。

离散余弦变换（DCT）：对对数梅尔滤波器组能量进行离散余弦变换，得到 MFCC 系数。DCT 可以将信号从时域转换到频域，同时具有良好的能量压缩性能。

GRNN 广义回归网络原理

GRNN 是一种基于径向基函数（Radial Basis Function，RBF）网络的改进型神经网络。它由输入层、模式层、求和层和输出层组成。

输入层：接收输入向量，其中为输入向量的维度。

模式层：每个神经元对应一个训练样本，其输出为输入向量与训练样本之间的距离的函数。常用的距离函数有欧氏距离、曼哈顿距离等。

求和层：由两个神经元组成，分别计算模式层输出的加权和。一个神经元计算模式层输出的算术和，另一个神经元计算模式层输出的加权和。

输出层：输出为求和层输出的函数，通常为线性函数。

5.算法完整程序工程

OOOOO

OOO

原文地址：https://blog.csdn.net/aycd1234/article/details/142995412

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【JVM】—深入理解G1回收器——概念详解
下一篇：开源新生活，社区齐乐活：COSCon'24 社区合作和开源集市招募中，诚邀广大社区参与！...

基于SpringBoot的旅游网站的设计与实现
首页：展示网站的核心功能和服务，方便用户快速了解网站。个人中心：提供用户的个人信息管理功能，包括查看和修改资料等。用户管理：对用户进行管理和审核，确保网站的安全性。线路分类管理：对旅游线路进行分类管理
阅读更多2024-10-18
【无标题】
Apache Hive 是一个分布式、容错的数据仓库系统，能够实现大规模的分析。Hive Metastore (HMS) 提供了一个元数据存储库，可以轻松分析这些元数据以做出基于数据的决策，因此它是许
阅读更多2024-10-18
刚刚，ChatGPT推出Windows客户端！
刚刚，ChatGPT推出Windows客户端！
阅读更多2024-10-18
MAC 电脑Office power point编辑的时候，显示“某些字体无法随演示文稿一起保存，仍然要保存演示文稿吗？”
在使用mac电脑的power point打开别人的.ppt文件之后，在保存的时候，弹出““某些字体无法随演示文稿一起保存，仍然要保存演示文稿吗？”，每次只要保存就需要重新嵌入字体很麻烦，如何解决这个问
阅读更多2024-10-18
VMware NSX 4.2.1 发布，新增功能概览
VMware NSX 4.2.1 发布，新增功能概览
阅读更多2024-10-18
【JAVA毕业设计】基于Vue和SpringBoot的课程智能组卷系统
随着教育信息化的推进，越来越多的学校和教育机构开始采用智能组卷系统，市场需求不断增加，为智能组卷系统的发展提供了广阔的市场空间。因此，从技术、教学效果、市场需求等多个方面来看，课程智能组卷系统具有较高
阅读更多2024-10-18
计算机毕业设计hadoop+spark知识图谱中药推荐系统中药材推荐系统中药可视化中药数据分析中药爬虫机器学习深度学习人工智能大数据
计算机毕业设计hadoop+spark知识图谱中药推荐系统中药材推荐系统中药可视化中药数据分析中药爬虫机器学习深度学习人工智能大数据
阅读更多2024-10-18
4.8 大数据发展趋势
我想与大家探讨一个充满潜力和变革的主题——大数据的发展趋势。大数据不仅正在改变我们的工作和生活方式，更是推动社会进步和经济发展的关键因素。
阅读更多2024-10-18
k8s备份恢复工具--velero
k8s的备份和恢复工具主要包括服务端和客户端两部分，服务端运行在k8s集群中，客户端运行在本地的命令行，本地需要配置好k8s的kubeconfig和kubectl客户端工具需要对象存储当做中间备份或存
阅读更多2024-10-18
【Python数据可视化】利用Matplotlib绘制美丽图表！
Matplotlib 是 Python 中一个广泛使用的 2D 图形绘图库，提供了从简单到复杂的各种图表类型。它以简单易用的 API 和丰富的自定义能力为用户所喜爱。无论是科研、工程应用，还是金融数据
阅读更多2024-10-18

基于GRNN广义回归网络和MFCC的语音情绪识别matlab仿真,对比SVM和KNN

1.算法运行效果图预览

2.算法运行软件版本

3.部分核心程序

4.算法理论概述

5.算法完整程序工程

相关文章