GPT-SOVIT模型部署指南

🕗 发布于 2024-10-09 12:55 音频生成语音转换文本转语音 TTS 算力

一、模型介绍

强大的小样本语音转换和文本转语音 WebUI。

具有以下特征：

零样本 TTS：输入 5 秒的声音样本并体验即时文本到语音的转换。
少量样本 TTS：仅使用 1 分钟的训练数据对模型进行微调，以提高语音相似度和真实感。
跨语言支持：使用不同于训练数据集的语言进行推理，目前支持英语、日语、韩语、粤语和中文。
WebUI 工具：集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

二、部署流程

测试环境

Python 3.9、CUDA 12.1

1.克隆

git clone https://github.com/RVC-Boss/GPT-SoVITS.git
cd /GPT-SoVITS/

2.创建虚拟环境并安装

conda create -n GPTSoVits python=3.9
conda activate GPTSoVits
bash install.sh

3.安装ffmpeg

conda install ffmpeg

4.安装依赖项

pip install -r requirements.txt

5.预训练模型

用户可以在这里下载所有这些模型。

从 GPT-SoVITS 模型下载预训练模型并将其放置在 GPT_SoVITS/pretrained_models。
下载 G2PW 模型G2PWModel_1.1.zip，解压并重命名为 G2PWModel，然后将其放置在 GPT_SoVITS/text。(仅支持中文 TTS)
对于 UVR5（此外还有人声/伴奏分离和混响消除），从UVR5 Weights下载模型并将其放入 tools/uvr5/uvr5_weights。
对于中文 ASR（另外），从Damo ASR 模型、Damo VAD 模型和Damo Punc 模型下载模型并将它们放置在中 tools/asr/models。
对于英语或日语 ASR（另外），请从Faster Whisper Large V3下载模型并将其放入 tools/asr/models。此外，其他模型可能具有类似的效果，但磁盘占用空间更小。

也可从modelscope下载：

git lfs install
git clone https://www.modelscope.cn/AI-ModelScope/GPT-SoVITS.git

6.数据集格式

TTS 注释.list 文件格式：

vocal_path|speaker_name|language|text

语言词典：

‘zh’：中文
‘ja’：日语
‘en’：英语
‘ko’：韩语
‘粤’：粤语

三、推理

python webui.py

四、页面演示

原文地址：https://blog.csdn.net/SJJS_1/article/details/142779962

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C# WinForms 控制权限到按钮级别
下一篇：SQL Server 常用关键词语法汇总

使用 HTML 和 CSS 创建 3D 菜单效果
通过几行简单的 HTML 和 CSS，我们就能创建一个非常有视觉吸引力的 3D 菜单效果。我们在一个 div 容器中使用无序列表（），每个菜单项是一个链接（），并且通过 data-text 属性来存储
阅读更多2024-10-09
初一系列——绝对值
啊，哈喽，小伙伴们大家好。我是#张亿，今天呐，学的是初一系列——绝对值
阅读更多2024-10-09
神经元的电学特性
按照惯例，
阅读更多2024-10-09
命令设计模式
命令模式（Command Pattern）是对命令的封装，每一个命令都是一个操作：请求方发出请求要求执行一个操作；接收方收到请求，并执行操作。命令模式解耦了请求方和接收方，请求方只需请求执行命令，不用
阅读更多2024-10-09
【总结分享】10种常用前后端鉴权方法，让你不再迷惘
扫码登录通常见于移动端 APP 中，很多 PC 端的网站都提供了扫码登录的功能，无需在网页上输入任何账号和密码，只需要让移动端 APP (如微信、淘宝、QQ等等) 中已登录用户主动扫描二维码，再确
阅读更多2024-10-09
搭建电商商城系统各项功能时需要用到的电商API数据采集接口
在搭建电商商城系统时，选择合适的电商API接口至关重要。
阅读更多2024-10-09
JS设计模式之策略模式：灵活、可扩展的编程利器
在 JavaScript 前端开发中，随着代码规模的增长和项目的复杂性，我们常常需要处理各种不同的条件和情况，而这可能导致代码变得冗长、难以维护。这时，我们就需要一种强大而灵活的编程模式来应对这些复杂
阅读更多2024-10-09
Spring Boot应用开发详解
Spring Boot是一种基于Spring框架的轻量级开发框架，它简化了Spring应用的开发过程，提供了一套预设的开发规范和约束，并且内置了大量常用的第三方库。Spring Boot的核心思想是“
阅读更多2024-10-09
大数据在金融领域的应用及其未来趋势
例如，通过分析客户的交易记录、社交媒体数据和线上活动，金融机构可以了解客户的消费模式、投资倾向和风险承受能力，从而提供更精准的个性化服务。未来，金融机构将依托人工智能技术，结合大数据的海量信息，构建更
阅读更多2024-10-09
AutoDL服务器训练YOLOv8全过程
在计算机视觉领域，目标检测技术应用广泛。YOLOv8 因其高效的实时检测能力和优越的性能备受关注，为了更好地利用这一强大的工具，本文将详细介绍如何通过 AutoDL 服务器训练 YOLOv8 模型。无
阅读更多2024-10-09