IM项目-----语音识别子服务

🕗 发布于 2024-09-20 07:56 微服务 rpc etcd c++ 项目

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、搭建思想
二、服务器搭建
三.测试

前言

语音转换子服务，用于调用语音识别 SDK，进行语音识别，将语音转为文字后返回给网关。

语音消息的文字转换：客户端进行语音消息的文字转换。

在这里插入图片描述

一、搭建思想

1.参数解析 – 基于gflags模块
rpc所需信息:
当前服务器的地址端口:用于搭建rpc服务器的监听地址信息

服务注册所需信息:
注册中心的地址端口:用于进行向服务注册中心进行服务注册

外部访问的地址端口:用于告诉注册中心的访问地址信息

语音识别平台所需信息
(app id，api key，secret key)

日志模块所需信息:
运行模式，日志文件名称，日志输出级别

2.初始化日志模块
3.搭建RPC服务器–实现语音识别业务接口功能
4.向注册中心进行服务注册

在这里插入图片描述

二、服务器搭建

1.继承speechService类,重写业务代码

只有一个rpc服务，就是进行语音识别，请求方需要将语音文件内容发送过来，我们在需要调用语音识别sdk,因此在成员变量中有一个ASRClient。这个变量是在make_rpc时传入进来的，在创建rpc时需要添加服务。

//1.继承SpeechService服务类，重写业务方法
    class SpeechServiceImpl :public SpeechService
    {
    public:
        SpeechServiceImpl(const ASRClient::ptr& _asr_client)
            :_client(_asr_client)
        {

        }

        ~SpeechServiceImpl(){};

        //重写业务方法
        void SpeechRecognition(google::protobuf::RpcController* controller,
                        const ::lkm_im::SpeechRecognitionReq* request,
                        ::lkm_im::SpeechRecognitionRsp* response,
                        ::google::protobuf::Closure* done)
        {
            brpc::ClosureGuard rpc_guard(done);
            
            //解析出请求中的语音数据
            //基于语音识别sdk进行语音识别调用，获取语音转文字结果
            std::string err_msg;
            std::string resp = _client->recognize(request->speech_content(),err_msg);
            if(resp.empty()){
                //语音转文字失败
                LOG_ERROR("requestId = {} 语音识别失败.",request->request_id());
                response->set_request_id(request->request_id());
                response->set_success(false);
                response->set_errmsg(err_msg);
            }
            //构造响应返回
            response->set_request_id(request->request_id());
            response->set_success(true);
            response->set_recognition_result(resp);
        }
    private:
        ASRClient::ptr _client;     //语音识别客户端
    };

2.编写语音识别服务器类

在语音识别子服务中有三个对象，一个是服务注册对象，一个是语音识别对象,还有一个是rpc服务器。
服务注册对象的构建需要etcd服务器地址，注册的服务名称以及对应的主机地址。
语音识别对象的构建需要三个key.
rpc服务器构建需要rpc服务器监听的端口，还需要提供超时时间以及io线程数量.
构造这三个对象需要九个参数，因此我们使用建造者模式。

我们通过建造者类来构造这个对象，然后调用这个类提供的start方法，启动rpc服务器。

   //2.封装一个语音识别子服务服务器
    class SpeechServer
    {
    public:
    using ptr = std::shared_ptr<SpeechServer>;
        SpeechServer(const Registry::ptr& registry,const ASRClient::ptr& asr_client,const std::shared_ptr<brpc::Server>& server)
            :_registry(registry),_asr_client(asr_client),_server(server)
        {

        }
        ~SpeechServer(){}

        //启动rpc服务器
        void start()
        {
            _server->RunUntilAskedToQuit();
        }
    private:
        Registry::ptr _registry;    //服务注册对象
        ASRClient::ptr _asr_client;     //语音识别客户端
        std::shared_ptr<brpc::Server> _server;        //rpc服务器
    };

3.建造者类编写

这个类提供了三个方法make_**(),需要先调用这个三个方法，来分别构造出rpc服务器,服务注册和语音识别客户端。在调用build方法，生成一个speechServer对象，通过这个对象就可以启动服务器。

在构造服务注册对象时，就会向etcd进行服务注册。

//建造者类，具体思想是通过建造者类的build函数构造一个SpeechServer对象，通过这个对象启动rpc服务器
    class SpeechServerBuilder
    {
    public:
        void make_registry(const std::string& etcd_host,const std::string& service_name,const std::string& service_host)
        {
            _registry = std::make_shared<Registry>(etcd_host);
            //进行服务注册
            _registry->registry(service_name,service_host);
        }

        void make_asr(const std::string &app_id,const std::string &api_key,const std::string &secret_key)
        {
            _asr_client = std::make_shared<ASRClient>(app_id,api_key,secret_key);
        }

        void make_brpc(uint16_t port, int32_t timeout = -1, uint8_t num_threads = 1)
        {
            if(!_asr_client){
                LOG_ERROR("语音识别客户端未构造");
                abort();
            }

            //创建brpc服务器对象
            _server = std::make_shared<brpc::Server>();
            //添加服务
            SpeechServiceImpl *SpeechService = new SpeechServiceImpl(_asr_client);    //把这个对象的交给_server释放
            int ret = _server->AddService(SpeechService,brpc::ServiceOwnership::SERVER_OWNS_SERVICE);
            if (ret == -1) {
                LOG_ERROR("添加rpc服务失败");
                abort();
            }

            brpc::ServerOptions options;
            options.idle_timeout_sec = timeout;
            options.num_threads = num_threads;
            ret = _server->Start(port,&options);
            if(ret == -1){
                LOG_ERROR("rpc服务器启动失败");
                abort();
            }
        }


        SpeechServer::ptr build()
        {
            if(!_registry){
                LOG_ERROR("服务注册客户端对象未构造");
                abort();
            }
            if(!_asr_client){
                LOG_ERROR("语音识别客户端未构造");
                abort();
            }
            if(!_server){
                LOG_ERROR("rpc服务器对象未构造");
                abort();
            }

            SpeechServer::ptr speechServer = std::make_shared<SpeechServer>(_registry,_asr_client,_server);
            return speechServer;
        }
    private:
        Registry::ptr _registry;    //服务注册对象
        ASRClient::ptr _asr_client;     //语音识别客户端
        std::shared_ptr<brpc::Server> _server;        //rpc服务器
    };

三.测试

#include "speech_server.hpp"

DEFINE_bool(run_mode, false, "程序的运行模式，false-调试； true-发布；");
DEFINE_string(log_file, "", "发布模式下，用于指定日志的输出文件");
DEFINE_int32(log_level, 0, "发布模式下，用于指定日志输出等级");

DEFINE_string(etcd_host, "127.0.0.1:2379", "注册中心主机地址");
DEFINE_string(base_service, "/service", "服务监控根目录");
DEFINE_string(instance_name, "/speech_service/instance", "当前实例名称");
DEFINE_string(access_host, "127.0.0.1:10001", "当前实例的外部访问地址");

DEFINE_string(app_id, "115608644", "语音平台应用ID");
DEFINE_string(api_key, "GLQvgyNc4AaqhPfnDIMTRlw4", "语音平台API密钥");
DEFINE_string(secret_key, "vTcqDBswZUfAgjTcFA3GJGrc6yEWIO2w", "语音平台加密密钥");

DEFINE_int32(rpc_port,10001,"rpc服务器监听端口");   //必须和access_host端口一致

int main(int argc,char*argv[])
{
    google::ParseCommandLineFlags(&argc, &argv, true);
    lkm_im::init_logger(FLAGS_run_mode, FLAGS_log_file, FLAGS_log_level);

    lkm_im::SpeechServerBuilder ssb;
    ssb.make_registry(FLAGS_etcd_host,FLAGS_base_service + FLAGS_instance_name,FLAGS_access_host);
    ssb.make_asr(FLAGS_app_id,FLAGS_api_key,FLAGS_secret_key);
    ssb.make_brpc(FLAGS_rpc_port);
    lkm_im::SpeechServer::ptr speechServer = ssb.build();
    speechServer->start();

    return 0;
}

原文地址：https://blog.csdn.net/2301_77412625/article/details/142362206

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：华为AR100-S路由器恢复出厂设置
下一篇：Redis实践之缓存：设置缓存过期策略

Linux系统下svn新建目录
Linux安装svn自行查找。
阅读更多2024-11-14
Scala的不可变Map常用操作
/3.1 get方法：输入key，如果找到，就返回包装数据，如果没有找到，就返回None。val map1 = Map("鄂"->"湖北省","
阅读更多2024-11-14
mqtt学习笔记（一）
mqtt相关笔记（一）之mqtt初探，以提出、解决问题的方式来逐步学习
阅读更多2024-11-14
Ken和Bwk趣说UNIX
[肯汤普森和布莱恩(AWK作者之一)趣说UNIX](https://www.bilibili.com/video/BV1nP411t7gt/ “肯汤普森和布莱恩(AWK作者之一 “肯汤普森和布莱恩(A
阅读更多2024-11-14
【CentOS】中的Firewalld：全面介绍与实战应用（上）
本文深入探讨了CentOS操作系统中Firewalld防火墙的全面功能与实战应用。首先，文章概述了Firewalld的基本概念，强调了它在现代Linux系统中作为动态管理防火墙规则的重要工具的地位。与
阅读更多2024-11-14
新手小白学习docker第七弹------安装redis集群大厂面试
新手小白学习docker第七弹----安装redis集群大厂面试
阅读更多2024-11-14
/// ts中的三斜线指令 | 前端
包），你需要在你的项目中以某种方式告诉TypeScript编译器这些类型定义的存在。三斜线指令是一种在单个文件中这样做的方式，虽然在实际项目中，更常见的是通过。1. 这行代码是TypeScript中
阅读更多2024-11-14
快速掌握——python类封装[私有属性方法]、继承【python进阶】(内附代码)
python类的封装【私有属性、私有方法、属性装饰器】类的继承
阅读更多2024-11-14
2024年5款大屏可视化工具多维分析对比
经过对市场上多款大屏可视化工具的深入研究和对比，强烈推荐FineVis作为您的首选。无论您是希望快速搭建大屏项目、展示复杂3D模型还是实现多屏适应和实时数据分析，FineVis都能满足您的需求。文章中
阅读更多2024-11-14
计算机网络-mac地址与ip地址的区别总结
mac地址在OSI模型中的第二层数据链路层工作，数据链路层基于mac地址进行转发数据帧【交换机基于mac地址表转发数据】ip地址在OSI模型中的第三层网络层工作，网络层基于ip地址转发报文【路由器
阅读更多2024-11-14