llamaindex实战-Agent的长期记忆(内存)演示

🕗 发布于 2024-11-11 04:58 LLM 大模型 chatgpt 人工智能

概述

本文使用本地嵌入大模型来演示llamaindex的Agent长期内存记忆：VectorMemory如何使用。

本地环境：16C32G Linux机器

背景

向量内存模块使用向量搜索（由向量数据库支持）来检索给定用户输入的相关对话项目。

本文演示了如何使用 VectorMemory 类。我们向您展示如何使用其各个功能。向量内存的一个典型用例是作为聊天消息的长期内存存储。

VectorMemory最终会把数据保存到向量数据库中：

本地运行代码

注意：先把嵌入模型：BAAI/bge-base-en-v1.5下载到本地目录。

（1）开始时，初始化一个原始内存模块并演示其功能 - 放置和检索 ChatMessage 对象。

（2）尝试重置并重试。这次，我们将添加一条助理消息。请注意，默认情况下，用户/助理消息是捆绑的。

from llama_index.core.memory import VectorMemory
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex, Settings
from llama_index.llms.ollama import Ollama
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.ollama import Ollama

local_model = "/opt/models/BAAI/bge-base-en-v1.5"
# local bge-base embedding model
Settings.embed_model = HuggingFaceEmbedding(model_name=local_model)


vector_memory = VectorMemory.from_defaults(
    vector_store=None,  # leave as None to use default in-memory vector store
    embed_model=Settings.embed_model,
    retriever_kwargs={"similarity_top_k": 1},
)


from llama_index.core.llms import ChatMessage

msgs = [
    ChatMessage.from_str("Jerry likes juice.", "user"),
    ChatMessage.from_str("Bob likes burgers.", "user"),
    ChatMessage.from_str("Alice likes apples.", "user"),
]


# load into memory
for m in msgs:
    vector_memory.put(m)

# retrieve from memory
print("retrieve from memory ...")
msgs = vector_memory.get("What does Jerry like?")
print(msgs)


msgs = [
    ChatMessage.from_str("Jerry likes burgers.", "user"),
    ChatMessage.from_str("Bob likes apples.", "user"),
    ChatMessage.from_str("Indeed, Bob likes apples.", "assistant"),
    ChatMessage.from_str("Alice likes juice.", "user"),
]
vector_memory.set(msgs)

print("resetting and trying again ...")
msgs = vector_memory.get("What does Bob like?")
print(msgs)

运行结果：

可以看到都得到了正确的结果。

retrieve from memory ...
[ChatMessage(role=<MessageRole.USER: 'user'>, content='Jerry likes juice.', additional_kwargs={})]

resetting and trying again ...
[ChatMessage(role=<MessageRole.USER: 'user'>, content='Bob likes apples.', additional_kwargs={}), 
ChatMessage(role=<MessageRole.ASSISTANT: 'assistant'>, content='Indeed, Bob likes apples.', additional_kwargs={})]

参考文献

Vector Memory - LlamaIndex

原文地址：https://blog.csdn.net/zg_hover/article/details/143655381

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：昇思大模型平台打卡体验活动：项目3基于MindSpore的GPT2文本摘要
下一篇：CMS垃圾回收流程的理解

网络安全入门教程（非常详细）从零基础入门到精通_网路安全教程
1.入行网络安全这是一条坚持的道路，三分钟的热情可以放弃往下看了。2.多练多想，不要离开了教程什么都不会了，最好看完教程自己独立完成技术方面的开发。3.有时多百度，我们往往都遇不到好心的大神，谁会无聊
阅读更多2024-11-13
【MySQL】MySQL中的函数之JSON_UNQUOTE
在 MySQL 中，函数用于去除 JSON 值周围的双引号，并将其转换为普通的字符串或数值。这个函数特别适用于从 JSON 文档中提取的值，因为这些值通常会被包含在双引号中。
阅读更多2024-11-13
西门子S120伺服驱动器F1910故障报警原因分析及处理
西门子S120伺服驱动器F1910故障报警原因分析及处理
阅读更多2024-11-13
(不看后悔系列二)python网络爬虫爬取网络视频
Python网络爬虫带你爬取下载网络视频
阅读更多2024-11-13
elementUI input 禁止内容两端存在空格，或者是自动去除两端空格
项目中有需求：输入框中禁止内容两端存在空格，或者是自动去除两端空格。
阅读更多2024-11-13
JavaWeb——Web入门（7/9）-Tomcat-介绍（Tomcat 的简介：轻量级Web服务器，支持Servlet/JSP少量JavaEE规范）
比如我们前面介绍的 XML，以及我们后面要学习的 JDBC，这些都是 Java EE 的规范。还有像 Servlet、JSP 这样的技术，现在基于 Servlet 进行项目开发呢，基本上已经很少很少了
阅读更多2024-11-13
就是这个样的粗爆，手搓一个计算器：存储单位换算计算器
作为程序员，没有合适的工具，就得手搓一个：在线计算器，存储单位换算计算器，PC端，移动端均可适用。废话不多说，直接上代码。
阅读更多2024-11-13
关于我、重生到500年前凭借C语言改变世界科技vlog.18——内存函数
内存函数是用于的一组函数，它们可以对内存进行复制、移动、设置和比较等操作。这些函数主要在头文件中声明，其操作对象通常是字节序列，不管这些字节代表的是字符、整数还是其他数据类型。
阅读更多2024-11-13
Warped Universe游戏即将在Sui上推出，为玩家提供多样化的游戏体验
Warped Games利用Sui实现玩家拥有的资产和多类型游戏玩法。
阅读更多2024-11-13
测试用例设计方法之场景法
场景法也叫流程图法, 使用流程图描述用户的使用场景, 然后通过覆盖流程路径来设计测试用例。
阅读更多2024-11-13

llamaindex实战-Agent的长期记忆(内存)演示

概述

背景

本地运行代码

参考文献

相关文章