Agents 要点

🕗 发布于 2024-07-11 16:51 人工智能

一、Agents概念

人类是这个星球上最强大的 Agent。Agent是一个能感知并自主地采取行动的实体，这里的自主性极其关键，Agent要能够实现设定的目标，其中包括具备学习和获取知识的能力以提高自身性能。

关键点：感知环境、自主决策、具备行动能力，设定明确的目标和任务，适应环境及学习能力

例如 Agent 的复杂程度各不相同，一个简单的恒温器可以是一个 Agent

一个大型的国家或者一个生物群体也可能是个 Agent。

垂直领域 Agent ：

比如 Alphago，还有使用强化学习打游戏的DeepMind的Agent57，更加通用的Gato，OpenAI玩“躲猫猫”的多智能体。

二、prompt 工程

提示词万能公式

角色+角色技能+

任务核心关键词+任务目标+任务背景+任务范围+任务解决与否判定+任务限制条件
输出格式/形式+输出量

https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor

三、Prompt外挂

外挂知识库数据库

这些还不够，尝试让 GPT 调用函数和使用工具，ChatGPT也推出了插件体系。当人们发现大模型的推理能力很差时，开始试图让模型自身清楚地描述问题，把问题转化为 PDDL （Planning Domain Definition Language）格式的描述语言，通过调用通用规划器来解决规划问题。

四、分解与组合

大模型在大任务执行能力上分解和组合。例如，

1.MapReduce 模式

将一个大型文本进行摘要，分开摘要在获得整体摘要

2、思维链（Chain of Thought，CoT），

它要求模型展示其思考过程

两种方式实现，一种是具体说明，即要求模型详细地、一步步地思考；

另一种是示例说明，即通过给定问题和答案的同时，提供思考过程。当询问模型时，模型会模仿此过程，逐渐思考并给出答案。

尝试多种思路来解决问题，然后投票选择最佳答案，这就是CoT-SC

3、思维树（ToT， Tree of Thought）

发散的方法也有局限性，例如24点问题，它不能很好地解决，解决方法垂直分解，思维树（ToT， Tree of Thought）的一个主要思路，它会根据当前的问题分解出多个可能，然后每一个树节点就是父节点的一个子问题，逐层扩散，遍布整个解空间，一些节点就直接会发现不合适而终止掉，达到了有效剪枝的作用。

比如排序问题，排序你可能需要分解和排序，然后再merge，COT就不行了

4、Graph of Tree，GoT

为了解决这个问题，一种名为思维图（Graph of Tree，GoT）的方法被提出。这种思维图既可以分解，也可以合并。

2023年9月26日，清华姚期智团队又提出了更新的方法——累计推理

首先会提出一个初步的想法，然后再对这个想法进行验证，看这个提案是否合适。如果提案合适，就将它添加到图的下一个节点，每一步都基于已经建立的图节点进行下一个思考节点的创建，这样发散、合并或删除直到达到最终目标状态，完备性和灵活性大大增强。24点问题上成功率已经达到98%

4、反馈

分解和组合，不能与外界进行互动，反馈是整个控制论的基石，也是动物体从诞生之初就具备的基本能力。

ReACT让大模型先进行思考，思考完再进行行动，然后根据行动的结果再进行观察，再进行思考，这样一步一步循环下去。基本上就是人类这样的智能体主要模式。

Agent的框架都会让模型输出JSON进行函数调用，OpenAI也就推出了Funtion Calling

五、Agents

1、AutoGPT

AutoGPT横空出世，短短数周Star数就超过PyTorch达到90k

创建一个初始的计划，然后进入主循环。系统会让模型判断在当前计划下该进行何种行动，接着会执行行动。执行完毕后，结果会写入下一次循环中。如此，每次决策都会基于之前的结果、记忆和计划，从而制定出新的行动方案。

2、jarvis gpt

微软的贾维斯 (Jarvis)一个深度学习任务调度系统，也采用了类似思想。他们主要关注如何调用模型来执行各种深度学习任务，涉及到了先做计划，再选择模型，然后执行任务，获取反馈，然后进入下一轮循环等环节。

3、Xagents

清华联合面壁发布了XAgent，提出了双循环机制在效果上碾压了AutoGPT

GPT-4也是一种Agent，Agent的概念是大模型的超集

1.6 Multi-Agent

斯坦福小镇"开了一个好头。在这个虚拟的小镇里，每个角色都是一个单独的智能体，每天依据制定的计划按照设定的角色去活动和做事情，

MetaGPT的项目

引起了广泛关注，这个项目中定义了产品经理、架构师、项目管理员、工程师和质量保证等角色，各角色之间通过相互协作，基本可以胜任完成500行左右代码的小工程了。

ChatDev的系统

清华开发了一个名为ChatDev的系统，进一步引入了CEO等角色，这里就不再展开描述。

RPA Agents

RPA 公司实在智能把 Agent 用于他们的产品调用常见桌面软件，如淘宝网、钉钉，来自动完成桌面任务。

Agent 的实现，共性:长短时记忆能力、工具使用能力、通信能力，甚至包括 SOP 的能力

AI在一定程度上模仿了人脑的工作方式，但实际上，机器人和人脑在处理信息时采用的策略有很大的不同。因此，即使在未来，我们也需要继续改进 AI 框架，以解决这种差距。比如一个百万位数的加法任务，GPT-4囿于token数的限制是不可能完成这个任务的，但人类却可以，这恰是人类和AI需要弥补的Gap。

五、智能本质

原文地址：https://blog.csdn.net/liuchenbaidu/article/details/140351072

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：VUE超详细入门
下一篇：maven7——(重要，构建项目)maven项目构建(命令)

Java-异步方法@Async+自定义分布式锁注解Redission例子
确保锁的超时时间足够长，能够覆盖业务逻辑的执行时间。锁的超时时间设置不当：锁的超时时间可能设置得太短，导致锁在业务逻辑执行完成之前就已经自。问题在于使用分布式锁时，第一个请求获取到锁并执行异步方法，但
阅读更多2024-11-19
C++和C中的类型转换方式以及带来的问题
例如，将一个较大的unsigned long long类型的值转换为unsigned int类型，这里b的值超出了unsigned int所能表示的最大值（4294967295），在隐式转换时会发生数
阅读更多2024-11-19
OMV7 树莓派 tf卡安装
配置好树莓派初始化设置，用户名、密码、wifi、ssh等都正确配置并启用。提示中明确提醒了，要给用户授权，否则之前能用ssh远程登录，现在就不行了。升级7之后，问题多多，不是docker不行了，就是代
阅读更多2024-11-19
P1048 [NOIP2005 普及组] 采药
【代码】P1048 [NOIP2005 普及组] 采药。
阅读更多2024-11-19
ssh.service could not be found“
ssh.service could not be found"
阅读更多2024-11-19
Java 类型转换（Type Casting）
类型转换是将一种数据类型（如整数int、浮点数float或双精度浮点数double）的值转换为另一种数据类型的过程。这种转换可以自动进行，也可以手动进行。编译器执行自动转换，而程序员则执行手动转换。为
阅读更多2024-11-19
学习大数据DAY61 宽表加工
建模: 使用建模工具 PowerDesigner Navicat 在线画图工具... 把表结构给绘。设计: excel 文档去编写。大表 - 把很多数据整合起来。共享\项目课工具\pd。
阅读更多2024-11-19
深入解析 Vue 3 中的 `v-model` 与相关知识点
默认情况下，v-model会使用的事件形式。例如上例中的和。开发者可以随意定义事件名称。v-model开发者可以在自定义组件中，灵活地支持v-model，以下是具体实现步骤。Vue 3 中的v-mod
阅读更多2024-11-19
xpath表达式学习总结
比如：获取a标签的所有父节点中所有class属性为"bird"的父节点，使用//a/parent::[contains(@class,“bird”)]比如：获取a标签的所有父亲节点
阅读更多2024-11-19
111页PPT丨服装零售行业数字化时代的业务与IT转型规划
安踏的数字化转型项目在方法论、计划和组织方面展现出了明确的目标、系统的规划和有效的执行。
阅读更多2024-11-19