音频分割：长语音音频分割为短语音音频 - python 实现

🕗 发布于 2024-10-19 14:37 ffmpeg 语音识别 人工智能 语音分割 python

在做语音任务时，有是会用到的语音音频是长音频，这就需要我们将长音频分割为短音频。

该示例将声音的音量和静默时间结合作为语音的分割条件。

使用音量和静默时间结合的分割条件，能够比较好的进行自然断句，不会话语没有说完就切断音频。

按照 python 库：

pip install pydub

具体实现代码如下：

#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频

from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''
    根据 音量 和 静默 时间长度 条件进行音频分割
    示例：音量阈值 -25 dB ， 静默阈值：300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)

# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):
    new = chunks[i]
    save_name = "{}{}.{}".format(chunks_path,i,audiotype)
    new.export(save_name, format=audiotype)

助力快速掌握数据集的信息和使用方式。

数据可以如此美好

原文地址：https://blog.csdn.net/weixin_42140236/article/details/142941668

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：实现双向链表的增删改查
下一篇：自定义有序 Map 类 OrderedMap

【Gradle】OutOfMemory JavaHeapSpace
【代码】【Gradle】OutOfMemory JavaHeapSpace。
阅读更多2024-10-19
Spring Boot优化大创项目风险评估流程
6、网络上的客户端和服务器可以用来编程任何独立的编程环境，也有中国，GB2312，BIG5，日文写作，一般基金，用于支持多国语言，并且可以嵌入在数据表和其他软件shift_jis访问柱可以用作的名称。
阅读更多2024-10-19
理解和重构目录结构：Java 中的父子关系管理
理解和重构目录结构：Java 中的父子关系管理
阅读更多2024-10-19
Redis相关面试题
1、会话缓存（SessionCache）最常用的一种使用 Redis 的情景是会话缓存（sessioncache），速度的下降，这是一个极大改进，类似 PHP 本地FPC。的使用 Redis 来缓存会
阅读更多2024-10-19
Nginx开发初步
在vim编辑器中查看signal.h的结果，看起来大概有32个信号可以看到，这些SIG开头的信号其实就是一些宏定义，信号名称被定义成了一些数字。同时可以发现，这些信号是从1开始编号的，编号0保留作其他
阅读更多2024-10-19
[项目详解][boost搜索引擎#1] 概述 | 去标签 | 数据清洗 | scp
本文介绍了搜索引擎项目的背景、宏观原理和技术栈，重点讲解了正排索引与倒排索引的差异，并展示了如何使用Parser进行数据清洗及Linux下文件传输技巧。
阅读更多2024-10-19
物质边际效应
重新拿起书本，开始阅读和学习，确实可以是一种有效的方式，帮助人们从日常的烦恼和压力中解脱出来，找到内心的平静和满足。书籍作为知识和智慧的载体，能够开阔视野，丰富思想，提供精神上的滋养和慰藉。通过阅读，
阅读更多2024-10-19
既然梯度下降法可以优化模型, 为什么还需要对模型进行正则化呢?
学艺不精, 突然有点分不清有什么区别, 于是我问了下AI, 一句话, 真香!
阅读更多2024-10-19
网络小说微信小程序(lw+演示+源码+运行）
微信开发者工具现在已经被小程序开发团队开发运行，目前微信开发者工具任然在不断的完善中，在开发小程序时经常要不断的更新。可以使用微信扫码登陆开发者工具，开发者工具将使用这个微信帐号的信息进行小程序的开发
阅读更多2024-10-19
Pytorch复习（二）
Pytorch
阅读更多2024-10-19

音频分割：长语音音频 分割为 短语音音频 - python 实现

相关文章

音频分割：长语音音频分割为短语音音频 - python 实现