大语言模型本地化部署思路

🕗 发布于 2024-04-13 14:35 语言模型 人工智能 自然语言处理

目前国内大语言模型犹如雨后春笋一样在神州大地生长，结合目前的政策形势，人工智能将迎来爆发式增长，目前发展状况通用大语言模型的部署将越来越容易，且能力将越来越强。但通用大模型如何赋能各行各业打造垂直大模型的应用呢？我想谈谈我对大语言模型本地化部署的几个思路：

一、直接部署大语言模型

这种部署比较容易，我们通过Huggface，或者魔搭平台（ModelScope）下载对应的模型，然后通过python的虚拟环境就可以快速的部署大语言模型。相比之下这样的部署没多大意义，因为通用大语言模型目前很多都是免费开放的，可以直接使用，所以建议使用大厂免费的服务直接使用。

二、对大语言模型进行全量调参

这种模式如果做好了，最终效果最好，但是其代价也是最高的，毕竟一般的大模型的参数动辄都是以“十亿”为计量单位，如果需要调参，需要大量的原始数据且要对数据进行标准化，因为数据质量直接影响大模型的最终效果。并且在训练的时候需要的硬件成本也是非常的高。所以该方法不是大厂基本不建议使用

三、结合本地知识库部署大语言模型

这种模式是使用的大语言模型对本地知识库内容的总结归纳能力，比如，我们本地文档特别多，但是我们的问题来自多个文档，获得数据比较零散，我们需要通过大语言模型对零散的知识进行归类总结。常用的方法 LangChain + chromadb + 大模型，这类方法比较适合企业存在大量的零散知识文档，我们的问题通常基于多个文档内容的，使用大模型的能力对找到的内容进行总结提升。

四、微调大语言模型

这种模式也比较适合搭建本地知识库，其原理是使用lora在大语言模型transformer的神经网络基础上，训练一个旁路网，本地问题可以通过旁路网络进行回答，效果较好。

ps：训练旁路网络的意义：因为预训练的大语言模型本身数据量较大，如果将本地一些知识放入大语言模型神经网络中，其实对大语言模型影响较小（毕竟数据量较少），所以我们考虑训练一个旁路网络，这样权重就在新的旁路网络中实现，可以实现堪比全量调参的效果

原文地址：https://blog.csdn.net/Scalzdp/article/details/137544345

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：milvus的compaction机制
下一篇：添加开关库 Android Studio

项目管理——Gantt图与Pert图
本文是在关于软考中软件设计师中的项目管理中的知识点，关于Gantt图与Pert图。
阅读更多2024-10-11
如何从U盘恢复已删除的文件
有时我们不知道如何恢复已删除的重要数据，尤其是在没有备份的情况下。但是，你在 U 盘中备份了重要数据，因此你不会担心丢失数据。所以，这就是关于从 U 盘恢复已删除文件的分步教程的全部内容。免费下载软件
阅读更多2024-10-11
Java利用itextpdf实现pdf文件生成
最近公司让写一个数据页面生成pdf的功能，找了一些市面代码感觉都太麻烦，就自己综合性整合了一个便捷的工具类，开发只需简单组装数据直接调用即可快速生成pdf文件。望大家一起学习！！！
阅读更多2024-10-11
彻底理解TypeScript对象语法
对象、索引签名、类、抽象类，实现接口
阅读更多2024-10-11
await的作用（举例）
问：当方法a中又三个方法a1、a2、a3、a4都是异步函数，现在在a2、a4追加await，方法执行顺序是什么？主进程顺序是什么？答：通过一个具体的例子来说明当方法 a 中有四个异步方法 a1、a2、
阅读更多2024-10-11
程序的开发流程
查看页面原型明确需求。
阅读更多2024-10-11
springboot仓库管理系统
基于springboot+vue实现的仓库管理系统（源码+L文+ppt）4-087。
阅读更多2024-10-11
python透视表pivot_table用法
简单来说，pivot_table 用于汇总数据。它允许你根据某些列进行分组，并对其他列的数据进行聚合统计。pivot_table 提供了很大的灵活性，可以指定如何聚合（如求和、求平均、计数等），并可以
阅读更多2024-10-11
互联网协议（IP）中最常用的端口
80 端口和 443 端口是互联网协议（IP）中最常用的两个端口，分别用于 HTTP 和 HTTPS 通信。
阅读更多2024-10-11
python爬虫 - 初识正则表达式
正则表达式作为一种强大的文本处理工具，广泛应用于编程、文本编辑和数据处理等领域。通过定义一系列字符和符号的组合，正则表达式能够快速识别、搜索、替换和操作文本中的特定模式，极大地提高了文本处理的效率。在
阅读更多2024-10-11

大语言模型本地化部署思路

相关文章