大模型学习笔记十四：Agent模型微调

🕗 发布于 2024-07-25 10:48 学习笔记

文章目录

学习目的
1、理解什么情况下需要训练一个具备Agent能力的模型？
2、如何训练一个具备Agent能力的模型？重点是训练数据的构建
3、如何评测Agent能力？
4、如何提升模型的泛化性？

一、大模型需要Agent技术的原因

需求
1、帮我查一下今天的销售额？
2、（开车时）前方为啥堵车了？
3、刘德华多少岁了
4、请帮我约一个和搜索产品部的需求沟通会，本周三至周五我日历上空闲的时间都可以；
5、帮我订一张周五去上海的机票
原因
1、大模型的“幻觉”问题，很难在从模型本身上彻底解决，在严肃的应用场景需要通过引入外部知识确保答案的准确；
2、大模型参数无法做到实时更新，本身也无法与真实世界产生实时连接，在多数场景下难以满足实际需求；
3、复杂的业务场景需要
大模型技术框架回顾

二、Prompt Engineering可以实现Agent吗？

回答
可以，前面弄的AutoGPT就是例子。除了AutoGPT外，还有ReACT、ModelScope、ToolLLaMA等不同的形式。
主流Agent prompt的比较

三、既然AutoGPT可以满足需求，为什么要额外训练一个Agent模型？

解答
1、很多场景下无法使用大模型API，需要私有化部署；
2、实践证明，除了GPT4 level的大模型，其他大模型（包括GPT3.5）无法很好遵从prompt要求完成复杂的Agent任务；
3、通过训练，一个小参数量的大模型（13B、7B等）也能达到较好的能力，更加实用

四、怎么去训练一个Agent模型？

目标
攀登背景最高峰，帮忙做个规划
规划图

1）数据准备和处理

2）模型训练

3）模型效果评估

五、如何提高Agent的泛化性？

1）Meta-Agent

2）训练数据构建

六、开源项目介绍

七、总结

1、Agent Tuning 的主要动机是训练大模型的 Agent 能力，尤其是希望通过训练让小参数量模型也能具备特定业务场景的 Agent 能力；
2、Agent Prompt 可以有不同的描述方式，通常包括Profile、Instruction、Tools、Format、Memory、Goal等部分；
3、可以采用自动评估和人工评估相结合的方法来评估 Agent 能力；
4、采用 Meta-Agent 方法可以构建多样性的 Agent Prompt 模板，再结合Query、Tools的多样化，可以训练出能力更加泛化的模型

原文地址：https://blog.csdn.net/weixin_43679037/article/details/140644780

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：使用sheetjs导出CSV文本为excel
下一篇：大厂面试官问我：两个1亿行的文件怎么求交集？【后端八股文十五：场景题合集】

info 命令：查看命令手册
在 Linux 系统中，可以使用man 查看普通的帮助手册。还可以使用info 命令阅读 Info 格式的文档。info 文档的特点：大量使用超链接，通过方向键将光标移动到链接的文字，按下回车
阅读更多2024-09-20
【内网渗透】最保姆级的春秋云镜Privilege打靶笔记
在xradmin/ruoyi-admin/src/main/resources/application-druid.yml找到Oracle的账密。internal-secret/credentials
阅读更多2024-09-20
【PyTorch】深入浅出PyTorch
Why learn PyTorchPyTorch日益增长的发展速度与深度学习时代的迫切需求构建知识体系熟悉知识分布对应查缺补漏
阅读更多2024-09-20
uniapp快速入门教程，内容来源于官方文档，仅仅记录快速入门需要了解到的知识点
官方文档：https://uniapp.dcloud.net.cn/必需技术：uniapp、vuejs 3、ES6及以上常用语法、pinia、css、scss‌‌ES6（‌ECMAScript 6）是
阅读更多2024-09-20
卷积和add、sub、mean等的转换
1的卷积，那么结果的大小为500。
阅读更多2024-09-20
搜维尔科技：OptiTrack采集到的平衡数据，并对人形机器人进行编程，可以确保机器人的动作精度和准确性
2.反馈与调整：将实时跟踪得到的机器人运动数据与预设的运动轨迹或目标动作进行对比，发现偏差后及时反馈给机器人的控制系统。2.路径规划：基于OptiTrack提供的环境信息和机器人的当前位置、目标位置等
阅读更多2024-09-20
Vue2+vue-office/excel 实现在线加载Excel文件预览
Vue2+vue-office/excel 实现在线加载Excel文件预览
阅读更多2024-09-20
第十一章【后端】商品分类管理微服务（11.5）——增强响应
这样，理论上已经实现了我们所想要的统一后端响应格式了，但是我们每写一个接口都要调用。结构，造成不一致，因此我们需要将响应格式统一起来，定义一个统一的标准响应格式。在前后端分离的开发模式下，我们一般会统
阅读更多2024-09-20
大文件编辑器(QT)
大文件编辑器， QSciscintilla, QsciLexerCPP
阅读更多2024-09-20
服务监控插件全览：提升微服务可观测性的利器
通过以上介绍，我们可以看到 New Relic 是一个功能全面、性能优异的监控工具，适用于各种分布式系统的监控需求。通过以上介绍，我们可以看到 Wavefront 是一个功能全面、性能优异的监控工具，
阅读更多2024-09-20