树莓派智能语音助手实现音乐播放

🕗 发布于 2024-09-21 16:12 语音识别 人工智能 python rasa 树莓派

树莓派语音助手从诞生的第一天开始，我就想着让它能像小爱音箱一样，可以语音控制播放音乐。经过这些日子的倒腾，今天终于实现了。

接下里，和大家分享下我的实现方法：首先音乐播放模块用的是我在上一篇博文写的《用sounddevice实现连续的音乐曲库播放》，然后语义解析部分依旧用的是RASA，具体做法同前不久实现的《让树莓派智能语音助手实现定时提醒功能》，即用RASA解析语义，返回关键字指令给语音助手，语音助手负责调用sounddevice编写的语音库执行指令。

RASA部分主要定义了4个新的intent和4个新的actions。

如上分别是stories.md和nlu.md新增部分，最右边的是其中一个actions的举例，没啥技术含量，剩下三个就不贴了。另外，domain.yml部分记得把intent和actions定义一下。这些就是RASA的全部内容了。

再来看语音助手的demo.py部分。这次我把收到语义解析后的代码都重新改写了一下：

if resp == "有需要再叫我":
           print("对话结束，等待呼唤……"+time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))) 
           status = 0
        elif resp == 'play_music':
           resp = ""
           if flag:
               playMusic()
        elif resp == 'next_song':
           resp = ""
           nextSong()
        elif resp == 'prev_song':
           resp = ""
           prevSong()
        elif resp == 'stop_music':
           resp = ""
           stopMusic()
        else:
           index0 = resp.find('5分钟后提醒')
           if index0 != -1:
              text0 = '/EXTERNAL_reminder'
              t = threading.Timer(300, act_remind, args=[text0])
              t.start()
        if resp != "":
           print("回复内容:"+resp)
           tts.text_to_speech(resp)
        else:
           print("播放音乐，对话结束，等待呼唤……"+time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())))
           status = 0
        time.sleep(0.5)

以上代码放在callback函数“print("解析耗时:"+f'{time.time() - t:.4f}s')”这句话之后。除了这部分，再定义四个函数。

import music
import random

musicThreads = []
count = 0
index = 0
flag = True

def playMusic():
   global index
   global count
   global flag
   global musicThreads
   musicThread = music.MusicThread()
   musicThreads.append(musicThread)
   count = musicThread.getCount()
   index = random.randint(0, count-1)
   musicThread.setId(index)
   musicThread.start()
   flag = False

def stopMusic():
   global index
   global count
   global flag
   global musicThreads
   index = musicThreads[-1].getId()
   musicThreads[-1].setId(count-1)
   musicThreads[-1].stop()
   flag = True

def nextSong():
   global index
   global musicThreads
   musicThreads[-1].stop() 

def prevSong():
   global index
   global musicThreads
   index = index - 1
   musicThreads[-1].setId(index)
   musicThreads[-1].stop()

所有这些语音助手部分的代码都是基于最初的《树莓派智能语音助手之功能整合》修改的，有兴趣的小伙伴可以自行拼接。

好了，执行了如上代码后，树莓派智能语音助手也可以通过语音播放音乐了。

最后补充3个事情：

1.语音控制模块我是调用了sounddevice和soundfile的库，其中soundfile又是基于libsndfile来解码音频文件的。但是，我的raspbian能升级的libsndfile版本最高只有1.0.28，这个库在1.1.0版本下是不支持MP3解码的，所以，最终播放的音乐，我都是在pc端把MP3转格式为wav后才能使用。但是我在pc端windows下没有这个问题。在使用这个库之前可以先查看一下libsndfile的版本。

2.用于语音识别的录音模块我用的也是sounddevice，所以，要修改下record.py，在下面这句中添加一个参数device=，等号后面填写你录音所用的设备编号。

audio = sd.rec(int(self.duration * self.sample_rate), samplerate=self.sample_rate, channels=1)

查看有哪些音频设备，可以在终端输入：

python -m sounddevice

回车后就会list你可用音频设备列表，如下图就是我树莓派上的，我选择的是2号USB PNP SOUND DEVICE，所以上面新增的device参数可以写device=3

这样修改后，就可以让音乐播放和语音输入两个功能相对独立存在。

3.一开始在执行音乐播放时遇到了output underflow的提示，导致语音助手都卡壳了。后来查了文档解决了这个问题，具体解决方法可以看：

用sounddevice播放音乐遇到output underflow提示-CSDN博客

原文地址：https://blog.csdn.net/hydekong/article/details/142266041

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：CPU性能监控：从理解CPU上下文切换开始
下一篇：CSS-媒体查询

谷歌推出设备内置人工智能，实时向手机用户发出诈骗电话警报
Google 宣布推出适用于 Android 的新安全功能，可实时防御诈骗和有害应用。
阅读更多2024-11-16
动手学深度学习70 BERT微调
13 bert一般可以用工具转成c++ 开销大。考虑怎么提升bert性能。14 设备性能不高，可以用蒸馏bert。模型中有大量冗余的东西。9 10, 一般不固定，固定参数可以使训练速度加快，可以尝试
阅读更多2024-11-16
怎么改变网络IP地址：实用指南与注意事项
在数字化时代，IP地址作为设备连接互联网的“身份证”，扮演着至关重要的角色。无论是出于隐私保护、访问限制绕过，还是网络安全考虑，有时我们需要更改设备的IP地址。然而，对于许多非技术用户而言，这一过程可
阅读更多2024-11-16
huggingface 下载方法测试ok
huggingface 下载方法：
阅读更多2024-11-16
计算机网络（10）网络性能
在计算机网络中，网络性能是指网络传输数据的效率、速度和稳定性。
阅读更多2024-11-16
Springboot校园失物招领平台
Springboot校园失物招领平台
阅读更多2024-11-16
HarmonyOS 如何获取设备信息（系统、版本、网络连接状态）
HarmonyOS 提供了一个强大的 API 集，方便开发者获取设备的硬件和软件信息。通过模块的deviceInfo接口，开发者可以访问设备的型号、品牌、系统版本等详细信息。本文将详细介绍如何使用这些
阅读更多2024-11-16
Vue3集成搜索引擎智能提示API
问题：因为API返回的是JSONP数据，JSONP是跨域访问的一种方式，网上很多都是用的原生的 js 代码去发送请求，嵌入到vue中不太方便，因此我想着vue能不能直接发送jsonp 请求，后面发现v
阅读更多2024-11-16
【Linux】Linux 权限的理解
本文简单介绍了Linux的基础知识--权限。
阅读更多2024-11-16
Python 中.title()函数和.lower()函数
将字符串中的每一大写字母都变成的小写字母。将字符串中的每一单词的首字母大写。1.lower()函数的功能。1.title()函数的功能。一.title()函数。二.lower()函数。
阅读更多2024-11-16

树莓派智能语音助手实现音乐播放

相关文章