新一代大规模声音克隆 TTS 模型——MaskGCT
新一代大规模声音克隆 TTS 模型——MaskGCT
- 论文链接:https://arxiv.org/abs/2409.00750
- 样例展示:https://maskgct.github.io
- 模型下载:https://huggingface.co/amphion/maskgct
- Demo 展示:https://huggingface.co/spaces/amphion/maskgct
- 项目地址:https://github.com/open-mmlab/Amphion/tree/main/models/tts/maskgct
- 公测应用:voice.funnycp.com
该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
Amphion: An Open-Source Audio, Music and Speech Generation Toolkit
原文地址:https://blog.csdn.net/ARPOSPF/article/details/145269064
免责声明:本站文章内容转载自网络资源,如侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!