开源音频处理项目推荐【持续更新】

🕗 发布于 2024-09-25 07:46 音视频音频 人工智能 语音大模型 深度学习

Audacity

介绍：Audacity是一款功能强大的开源音频编辑软件，适用于多种操作系统，包括Windows、macOS和Linux。它支持多轨音频编辑、录制，并且提供了丰富的音频处理功能，如剪切、复制、粘贴、混音、降噪等
。Audacity的最新版本是3.6版本，于2024年7月16日发布，带来了主通道、新效果、新主题等功能。
官网地址：https://www.audacityteam.org/
GitHub星数：12.3k
GitHub地址：https://github.com/audacity/audacity

Audacious

介绍：Audacious是一个开源的音乐播放器，它继承了XMMS的特性，并且在此基础上进行了改进和发展。Audacious支持多种音频格式，并且具有高度的可定制性，用户可以通过安装插件来扩展其功能。它支持Linux、BSD、macOS和Windows操作系统。
GitHub星数：819
GitHub地址：https://github.com/audacious-media-player/audacious

LMMS

介绍：LMMS是一个免费且开源的数字音频工作站（DAW），适用于Windows、Linux和macOS操作系统。它允许用户创作旋律和节奏，合成和混合声音，以及编排样本。LMMS提供了多种乐器和效果插件，支持VST和SoundFont，并且具有用户友好的现代界面。
GitHub星数：8k
GitHub地址：https://github.com/LMMS/lmms

VCV Rack

介绍：VCV Rack是一个开源的虚拟模拟合成器平台，它模拟了Eurorack模块，同时也支持原创模块。这个软件允许用户在Windows、Mac和Linux上构建和配置自己的虚拟模块合成器机架。VCV Rack包括一些内置模块，用户也可以通过安装更多的在线模块来扩展模块库。
GitHub星数：4k
GitHub地址：https://github.com/VCVRack/Rack

MuseScore

介绍：MuseScore是一个免费的、多功能的音乐制谱软件，它支持多平台如Windows、Mac和Linux。这个软件以其所见即所得的界面和易用性而受到许多音乐爱好者和专业人士的欢迎。MuseScore提供了丰富的功能，包括音符输入、乐谱编辑、MIDI和音频文件的导入导出、以及打印出精美的乐谱。
GitHub星数：12.1k
GitHub地址：https://github.com/musescore/MuseScore

The Synthesis ToolKit in C++ (STK)

介绍：The Synthesis ToolKit in C++ (STK) 是一个由Perry R. Cook和Gary P. Scavone开发的开源音频信号处理和算法合成库，它提供了一系列用C++编写的类，旨在促进音乐合成和音频处理软件的快速开发。STK的特点包括跨平台功能、实时控制、易用性以及提供教育性的示例代码。
官网：https://ccrma.stanford.edu/software/stk/
GitHub星数：1k
GitHub地址：https://github.com/thestk/stk

MockingBird

介绍：MockingBird 是一个开源的实时语音克隆项目，它基于先前的SV2TTS项目进行了改进和优化，以支持中文语音克隆。MockingBird 的主要功能是能够通过较短的语音样本快速克隆一个人的声音，并且可以用克隆的声音生成新的语音内容。这个项目在GitHub上有详细的安装和使用说明，以及如何进行调参以优化克隆效果的指导。
GitHub星数：35k
GitHub地址：https://github.com/babysor/MockingBird

Real-Time-Voice-Cloning

介绍：Real-Time-Voice-Cloning 是一个能够实时克隆声音并生成任意语音内容的开源项目。它基于谷歌2017年发布的论文SV2TTS，将克隆工作分为三个模块：编码器（Encoder）、合成器（Synthesizer）和声码器（Vocoder）。该项目能够快速适应新的声音，并且不需要大量的训练数据。
GitHub星数：52k
GitHub地址：https://github.com/CorentinJ/Real-Time-Voice-Cloning

ESPnet

介绍：ESPNet是一个开源的端到端语音处理工具包，它覆盖了包括自动语音识别（ASR）、文本转语音合成（TTS）、语音翻译（ST）、语音增强、说话人诊断以及口语理解等多个领域。ESPNet的核心采用PyTorch作为深度学习引擎，同时借鉴了Kaldi的数据处理方式、特征提取和配方，以确保对于不同语言和场景下的语音处理实验能够具备完整性和高效性。
GitHub星数：8.3k
GitHub地址：https://github.com/espnet/espnet

voice-changer

介绍：提供丰富的在线声音变换功能，包括音调调节、性别转换、匿名处理等。
GitHub星数：16.1k
GitHub地址：https://github.com/w-okada/voice-changer

原文地址：https://blog.csdn.net/yanceyxin/article/details/142502051

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：SpringBoot的应用
下一篇：RT-DETR改进策略：BackBone改进|PoolFormer赋能RT-DETR，视觉检测性能显著提升的创新尝试

COMSOL 声学多物理场仿真技术与应用
随着声学技术在各个领域的广泛应用，对于声学仿真的专业人才需求日益增长。Comsol 软件作为多物理场仿真的先进工具，其声学模块能够模拟声波在不同介质中的传播和交互，对于声学设计和研究具有重要意义声学仿
阅读更多2024-09-25
CF333E Summer Earnings 题解
先考虑暴力，我们先求出这些点两两之间的距离作为边，然后从大到小枚举这些边作为三角形中最短的一条边并加入图中，再枚举两个端点所连边，如果两个点有一个连边的公共点，那一定可行，且此处枚举的边即为最大值。三
阅读更多2024-09-25
每天一个数据分析题（四百七十二）- 业务角度
内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据分析从业者刷题必备神器！从业务角度区分，标签可以分为哪两类？A. 分
阅读更多2024-09-25
CentOS中使用Docker运行mysql并挂载本地目录
通过上述步骤，你就成功在 CentOS 中使用 Docker 安装了 MySQL 并将本地目录挂载到容器中的 MySQL 数据存储目录。这样可以确保数据的持久性，即使容器被删除或重新创建，数据仍然保存
阅读更多2024-09-25
lumen安装错误的解决Failed to download sebastian/recursion-context from dist
extension=zip //打开这里的开关。打开php.ini（对应版本的）
阅读更多2024-09-25
中年被裁，记录下这段时间的心路历程，内含前端面试题和面经
真正的转变都是痛苦且无声的。这段时间我经历了工作被裁员，学习复习，面试找工作，到最终找到工作。想把这段时间我的心路历程和面试题面经分享出来，说不定可以帮到你。
阅读更多2024-09-25
从入门到精通：单片机 100个关键技术关键词
无论你是电子爱好者，还是希望在这一领域深耕的专业人士，掌握单片机技术都是通往成功的关键一步。以下精选的100个关键技术关键词，将作为你从入门到精通的导航灯塔，每一步都踏在坚实的基石上，助你逐步揭开单片
阅读更多2024-09-25
MySQL—触发器详解
触发器是与表有关的数据库对象，在 INSERT、UPDATE、DELETE 操作之前或之后触发并执行触发器中定义的 SQL 语句。触发器的这种特性可以协助应用在数据库端确保数据的完整性、日志记录、数据
阅读更多2024-09-25
GPU高性能编程CUDA入门
最新版的 CMake(3.18 以上)，只需在LANGUAGES 后面加上 CUDA 即可启用。然后在 add executable 里直接加你的 .cu文件，和 .cpp 一样。CUDA和C++的关
阅读更多2024-09-25
风速预测（二）基于Pytorch的EMD-LSTM模型
本文基于前期介绍的风速数据（文末附数据集），先经过经验模态EMD分解,然后通过数据预处理，制作和加载数据集与标签，最后通过Pytorch实现EMD-LSTM模型对风速数据的预测。
阅读更多2024-09-25

开源音频处理项目推荐【持续更新】

Audacity

Audacious

LMMS

VCV Rack

MuseScore

The Synthesis ToolKit in C++ (STK)

MockingBird

Real-Time-Voice-Cloning

ESPnet

voice-changer

相关文章