React Agent 自定义实现

from tavily import TavilyClient
from llm.llm_api_key import TAVILY_API_KEY
import time


def tavily_search(query):
    try:
        # Step 1. Instantiating your TavilyClient
        tavily_client = TavilyClient(api_key=TAVILY_API_KEY)

        # Step 2. Executing a Q&A search query
        answer = tavily_client.qna_search(query=query)

        # Step 3. That's it! Your question has been answered!
        return answer
    except:
        time.sleep(1)
        # Step 1. Instantiating your TavilyClient
        tavily_client = TavilyClient(api_key=TAVILY_API_KEY)

        # Step 2. Executing a Q&A search query
        answer = tavily_client.qna_search(query=query)

        # Step 3. That's it! Your question has been answered!
        return answer


def height_search(name):
    height_dic = {
        "张三": 180,
        "李四": 175,
        "王五": 170,
        "赵六": 165,
        "钱七": 160,
        "孙八": 175,
        "周九": 170,
        "吴十": 165,
        "郑十一": 180,
        "王十二": 175,
        "李十三": 170,
        "赵十四": 165,
        "钱十五": 180,
        "孙十六": 175,
    }
    return height_dic.get(name)

工具描述，要让大模型理解工具，需要定义描述，这里参考的智谱官方的工具的描述写法：

tavily_search_tool = {
        "type": "function",
        "function": {
            "name": 'tavily_search',
            "description": "根据用户查询，去搜索引擎，返回搜索结果",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {
                        "description": "用户搜索内容 query",
                        "type": "string"
                    },
                },
                "required": ["query"]
            }
        }
      }

height_search_tool = {
        "type": "function",
        "function": {
            "name": 'height_search',
            "description": "只要是有姓名，身高关键字，都需要使用此工具根据姓名，查询对应身高，每次只能查询一个人的身高",
            "parameters": {
                "type": "object",
                "properties": {
                    "name": {
                        "description": "指具体的姓名或名字",
                        "type": "string"
                    },
                },
                "required": ["name"]
            }
        }
      }

问题设定

设定一个问题：

这个问题潜在意图是查询钱七，李四身高，并且搜索大模型定义，是想调用身高查询工具 2 次，搜索工具 1 次。

问题改写，挖掘潜在意图

为什么加这一步呢？因为把问题传给大模型后发现一个问题，它可能发现不了潜在意图，例如这里潜在意图要查询身高，问题中没有明显提出，大模型思考结果：

这样的话就只使用搜索工具就结束了，所以加了一步问题改写，去发现潜在意图，是利用大模型能力去做的，用 prompt，改写结果成功识别出潜在意图，并思考出要调用哪个工具：

尽你所能改写以下问题，可以有多个答案，可以参照以下工具进行改写，识别用户潜在意图:
```{tools}```
Question:`{query}`
Answer 按照以下格式，每一点代表一个意图，如果需要用到工具的需要列出工具名字，不需要具体参数：
```
1. 
2. 
...
```

React Prompt

React agent 核心的 prompt 怎么让模型自动规划，先来看 langchain 中的写法：

Answer the following questions as best you can. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer

Thought: you should always think about what to do

Action: the action to take, should be one of [{tool_names}]

Action Input: the input to the action

Observation: the result of the action

... (this Thought/Action/Action Input/Observation can repeat N times)

Thought: I now know the final answer

Final Answer: the final answer to the original input question

Begin!

Question: {input}

Thought:{agent_scratchpad}

传入变量 tool 为所有工具，tool_names 为所有工具名称列表，input 问题输入，agent_scratchpad 思考要做什么，怎么做。

参照进行改编：

尽你所能回答以下问题。您可以使用以下工具:
```{tools}```

严格使用以下 JSON 格式:
```
{{
    Question: 根据 thought 当前需要回答的问题，此字段必须存在
    Thought: 对于 Question 要做什么，此字段必须存在
    Action: {{'tool': 要采取的动作，应该是[{tool_names}]之一，如果不需要工具可以空着}}
    Action Input: 动作的输入，是一个 JSON 格式，此字段必须存在，如果不需要输入可以空着
    Observation: 行动的结果，此字段必须存在，默认为空
}}
```
(Question/Thought/Action/Action Input/Observation 五个字段必须存在，以上步骤只能重复 1 次)

开始吧!
Question:`{query}`
thought:`{agent_scratchpad}`

根据 agent_scratchpad 每次运行得到 json 的 action，接着提取工具名及参数，去进行工具调用，这里因为是 json，格式控制好了提取就方便了。

使用完工具后，把结果赋值给 Observation。

下一步规划

agent_scratchpad 就是下一步规划的思考，用 prompt 去进行规划，传给已经执行的 action，问题及思考，让自动规划下一步应该做什么：

# 背景
有一个问题 Question，已经有了对这个问题的思考 Thought，已执行的思考 Action，需要根据这些信息去规划出下一步应该做什么。

# 输入
## Question:`{query}`
## Thought:`{thought}`
## Action:`{all_action_res}`

# 思考推理：
- 1、参考 Question 仔细理解 Thought，思考 Action 还有哪些没有行动。
- 2、判断你下一步做什么行动，不能过于发散过多的行动，必须根据步骤 1 的思考。
- 3、确保你的回答在语义上与 Action 中的内容不重复是一个全新的步骤。
- 4、若 Thought 已经全部执行了，直接回答`no`。

# 输出要求(严格按照以下要求输出)
- 回答需要用一句话清晰的总结下一步需要做什么，不需要其他任何信息。
- 如果没有需要做的了，直接输出`no`，不需要其他任何信息，不需要解释任何理由。

这里遇到一个问题，就是可能会一直重复规划，导致死循环，在代码中加了判断，理论上开始重复规划了，说明已经没有可以给出新的规划了，那就结束吧。

问题总结

所有 action 的结果，用了一个列表保存的，最后用大模型自己去总结去回答问题就可以了。

D:\programming\dev_env\anaconda\anaconda3\python.exe "D:\Python_project\NLP\大模型学习\prompt-engineering\自定义 React Agant\run_agent.py" 
D:\programming\dev_env\anaconda\anaconda3\Lib\site-packages\langchain\callbacks\__init__.py:37: LangChainDeprecationWarning: Importing this callback from langchain is deprecated. Importing it from langchain will no longer be supported as of langchain==0.2.0. Please import from langchain-community instead:

`from langchain_community.callbacks import get_openai_callback`.

To install langchain-community run `pip install -U langchain-community`.
  warnings.warn(
输入 token：103/输出 token：268/总共 token：371/
问题改写，识别潜在意图：
1. 识别用户提到的“身高比较高的小伙子”和“长得像钱七”，可能需要查询钱七的身高信息（使用工具：height_search）。
2. 识别用户提到的“还有他跟他身高差不多的兄弟李四”，可能需要查询李四的身高信息（使用工具：height_search）。
3. 用户对“大模型”表示不清楚，需要解释或搜索“大模型”的定义和相关信息（使用工具：tavily_search）。
=====================================
输入 token：53/输出 token：376/总共 token：429/
解决此问题的思考 Thought：
根据用户的问题，我们需要查询钱七和李四的身高信息，并获取关于“大模型”的解释和相关信息。因此，我们需要使用height_search工具来查询身高信息，以及使用tavily_search工具来搜索大模型的相关内容。
=====================================
输入 token：89/输出 token：426/总共 token：515/
{'Action': {'tool': 'height_search'},
 'Action Input': {'name': '钱七'},
 'Observation': 160,
 'Question': '1. 识别用户提到的“身高比较高的小伙子”和“长得像钱七”，可能需要查询钱七的身高信息（使用工具：height_search）。',
 'Thought': '需要使用工具查询钱七的身高信息。'}
=====================================
输入 token：12/输出 token：289/总共 token：301/
下一步需要做什么：
需要使用工具查询李四的身高信息。
=====================================
输入 token：60/输出 token：435/总共 token：495/
{'Action': {'tool': 'height_search'},
 'Action Input': {'name': '李四'},
 'Observation': 175,
 'Question': '查询李四的身高信息。',
 'Thought': '使用height_search工具查询李四的身高。'}
=====================================
输入 token：14/输出 token：301/总共 token：315/
下一步需要做什么：
使用tavily_search工具搜索大模型的相关内容。
=====================================
输入 token：61/输出 token：437/总共 token：498/
{'Action': {'tool': 'tavily_search'},
 'Action Input': {'query': '大模型是什么意思'},
 'Observation': 'Based on the data provided, the term "大模型" (Big Model) refers '
                'to a method or technology used in the fields of machine '
                'learning and artificial intelligence to handle large-scale '
                'data and complex models. These models are typically '
                'constructed using deep neural networks with a large number of '
                'parameters, ranging from billions to even trillions. The '
                'purpose of big models is to improve model expressive power '
                'and predictive performance, enabling them to handle more '
                'complex tasks and datasets effectively. Big models play a '
                'crucial role in addressing challenges posed by increasing '
                'data volumes and model complexities in the field of AI and '
                'machine learning.',
 'Question': '大模型是什么意思？',
 'Thought': '使用搜索引擎查询大模型的相关信息。'}
=====================================
输入 token：10/输出 token：311/总共 token：321/
开始生成重复步骤，或已执行 action 过多，判断结束了！重复步骤：使用搜索引擎查询大模型的相关信息。
下一步需要做什么：
no
=====================================
输入 token：109/输出 token：332/总共 token：441/
最终答案：
根据您的描述，钱七的身高是160厘米，而李四的身高是175厘米。至于您提到的“大模型”，这是一种在机器学习和人工智能领域中使用的方法或技术。大模型通常指的是具有大量参数（从数十亿到数万亿不等）的深度神经网络模型。这些模型的目的是提高表达能力和预测性能，使它们能够更有效地处理大规模数据和复杂任务。

简而言之，大模型是为了应对人工智能和机器学习领域中数据量增加和模型复杂性提升的挑战而发展起来的技术。
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

Process finished with exit code 0

代码

prompt-engineering/自定义 React Agant at master · 5zjk5/prompt-engineering · GitHub

原文地址：https://blog.csdn.net/zjkpy_5/article/details/142965818

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：万界星空科技：智能称重打标系统
下一篇：Zabbix自定义监控8080端口的连接数

Spring MVC实现高效文件上传及优化案例
基于SSM实现springmvc文件上传功能
阅读更多2024-10-17
CTFHUB技能树之HTTP协议——响应包源代码
点击“开始”没有抓取到报文，先看看网页源代码是什么情况。居然直接给出flag了，不知道这题的意义何在。是个贪吃蛇小游戏，看不出来有什么特别的地方。
阅读更多2024-10-17
嵌入式面试——FreeRTOS篇（九）内存管理
FreeRTOS内存管理介绍：在使用 FreeRTOS 创建任务、队列、信号量等对象的时，一般都提供了两种方法：•动态方法创建：自动地从 FreeRTOS 管理的内存堆中申请创建对象所需的内存，并且
阅读更多2024-10-17
基于遥感技术的碳储量、碳收支、碳循环等多领域监测与模拟实践技术应用
卫星遥感具有客观、连续、稳定、大范围、重复观测的优点，已成为监测全球碳盘查不可或缺的技术手段，卫星遥感也正在成为新一代、国际认可的全球碳核查方法。本次目的就是梳理碳中和与碳达峰对卫星遥感的现实需求，
阅读更多2024-10-17
旋转花键材质及运用场景
旋转花键的材质有很多种，其材质选择是一个涉及多方面因素的重要决策，‌主要取决于应用场景的具体要求，包括设备的运行环境、负载大小、运行速度以及所需的耐磨性和耐腐蚀性等因素。
阅读更多2024-10-17
记bean对象之间的转换Orika使用（二）
A对象属性值转换到B对象，然后B再转换到A两个对象中的属性名不同的处理方法集合对象映射、对象中包含对象的映射
阅读更多2024-10-17
传输层协议UDP详解
传输层协议 ———— UDP，一篇即懂
阅读更多2024-10-17
2018年计算机网络408真题解析
协议是数据传输服务，的数据传输服务，的数据连接服务。和使用。而使用的是。TCP/IP应用层协议中，各个协议使用的传输层服务依次如下图所示：答案选。
阅读更多2024-10-17
OpenCV人脸检测与识别：构建智能识别系统
OpenCV进行简单的人脸检测与识别。我们通过读取并预处理图像、准备训练数据、训练人脸识别模型、进行预测以及显示结果等步骤，实现了基本的人脸识别功能。
阅读更多2024-10-17
Bug剖析
•所有的Bug报告有以下的基本要求：•标题。要简略。•指派。谁来处理这个问题。•重现步骤。问题再次出现的相关步骤。•优先级别。问题的紧迫性与重要性。•严重程度。问题所产生的后果。•解决方
阅读更多2024-10-17

React Agent 自定义实现

背景

langchin 中的 agent

langchin 中 agent 的问题

langchain 的 agent 案例

自定义 React Agent

大模型

工具定义

问题设定

问题改写，挖掘潜在意图

React Prompt

下一步规划

问题总结

代码

相关文章