SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型本地一键整合包下载

🕗 发布于 2024-07-13 09:59 语音识别 人工智能

阿里巴巴近期发布了开源语音大模型项目FunAudioLLM，该项目包含了两个核心模型：SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆

本地一键包下载地址： SenseVoice - 精准多语言语音识别与情感辨识模型本地一键整合包下载

SenseVoice：精准多语言识别与情感辨识

SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测，经过40万小时数据训练，支持超过50种语言的识别，其效果显著优于现有的Whisper模型，尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音，还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示，SenseVoice在情感辨识能力上也取得了行业领先的成果，能够检测到多种情感表现。

CosyVoice 这里就不多介绍，可以参考之前发布的一键包，CosyVoice一键包点此进入

本地测试了多轮音频，识别能力还是挺棒的，相比Whisper，SenseVoice的中文识别能力更胜一筹，精准度也更高。

使用也很简单，下载一键包，双击一键启动，进入WebUI界面

上传一段需要识别的音频，点开始即可

原文地址：https://blog.csdn.net/yihuaixu/article/details/140297499

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：一图展示免费开源的分布式版本控制系统Git
下一篇：探索WeNet：一个面向生产的端到端语音识别工具包

数据结构--单链表创建、增删改查功能以及与结构体合用
利用结构体和单链表创建学生管理系统，实现简易的增删改查功能
阅读更多2024-09-23
codeforces round974 div3 分层图树形dp
思路：首先注意到这个图只有n - 1条边，并且是连通的，也就是说这是一棵树。如果这是多个连续的被保护的点，这里以两个点为例，对答案的贡献就是gold - c - c其中一个c表示本身被相邻的点抢走的g
阅读更多2024-09-23
ML 系列：机器学习和深度学习的深层次总结(08)—欠拟合、过拟合，正确拟合
在有监督学习过程中，对于指定数据集进行训练，训练结果存在欠拟合、过拟合的情况，这两个情况都对模型的泛化是不利的，本篇对监督学习的训练的泛化问题进行解释。
阅读更多2024-09-23
【TabBar嵌套Navigation案例-产品推荐页面-UICollectionView-结合xib使用 Objective-C语言】
【TabBar嵌套Navigation案例-产品推荐页面-UICollectionView-结合xib使用 Objective-C语言】
阅读更多2024-09-23
Flutter为Android添加签名并打包
Flutter为Android添加签名并打包
阅读更多2024-09-23
漏洞挖掘 | Selenium Grid 中的 SSRF
Selenium 网格框架上的基本服务器端请求伪造
阅读更多2024-09-23
[SDX35+WCN6856]SDX35 + WCN6856 WiFi 起来之后，使用终端连接会导致系统重启
WCN6856 器件是一款高度集成的片上系统（SoC）支持 802.11ax Wi-Fi 和蓝牙（BT） 5.3。这WCN6856 支持在 2.4 GHz 和 5 GHz 上同时运行5GHz 或
阅读更多2024-09-23
股指期货交割方式是什么？
咱们平时买卖股票，那是看准了哪只股就下手，赚了就卖，赔了就扛，挺直接的。但股指期货呢，它玩的是未来的预期，就像是你跟人打赌明天天气好不好，赢了拿钱，输了掏钱，只不过这个“赌”是有规矩的，到期得按规矩“
阅读更多2024-09-23
链表练习包括（创建遍历插入删除逆置排序）
【代码】链表练习包括（创建遍历插入删除逆置排序）
阅读更多2024-09-23
深度学习-18-深入理解BERT实战使用预训练的DistilBERT模型
以两个方式使用预训练模型：(1)作为抽取嵌入表示的特征抽取器。(2)通过在下游像文本分类、问答等任务的微调预训练的BERT模型。
阅读更多2024-09-23

SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载

相关文章

SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型本地一键整合包下载