【大语言模型】如何让ChatGPT等LLM拥有记忆

🕗 发布于 2024-04-20 19:59 语言模型 chatgpt 人工智能

我们现在在跟ChatGPT等生成式人工智能聊天时，都需要我们给定一个上下文，生成式AI才会根据我们问题结合上下文给出回答，他们并没有任何记忆。想象一下未来我们有一个AI机器人在我们的身边，每天它的记忆都会归零，你必须跟它解释下过去发生了什么是多么痛苦的一件事。

这个问题需要引入Vector Database来解决，将向量数据库作为大型语言模型（LLM）如GPT-3或BERT的长期记忆使用是一种增强其功能的策略，特别适用于需要知识保留、上下文管理和从新信息中动态学习的任务。这种概念涉及利用向量数据库来存储和检索上下文和事实信息，这些信息可以在对话或任务中由LLM动态使用。

向量数据库是一种专门用于存储、索引和管理由机器学习模型生成的数据向量嵌入的数据库。这些向量嵌入是数据项（如文本、图像或声音）的高维表示，能够捕获它们的内容或特征的某些方面，以便计算机能够处理。这些嵌入通常由自然语言处理（NLP）或图像识别等现代AI模型生成。

向量数据库的关键特性

1. 高维索引：
向量数据库针对高维数据进行了优化，这些数据是许多现代AI模型的输出。与传统数据库可能难以处理维度的诅咒不同，向量数据库使用复杂的索引技术有效地在高维空间中进行查询。

2. 相似性搜索：
向量数据库的一个主要功能是执行相似性或接近性搜索。它们可以根据距离度量（如欧几里得距离、余弦相似度或曼哈顿距离）快速找到与给定查询向量最接近的向量。这对推荐系统、搜索引擎和异常检测等应用至关重要。

3. 可扩展性：
这些数据库旨在随着数据大小和维度的增长而扩展，能够处理数百万甚至数十亿个向量。

下面是一些常见的Vector Database：

如果大家感兴趣，我会在后面的文章详细讲解Vector的原理，给我留言。

原文地址：https://blog.csdn.net/Hyman_Qiu/article/details/137849778

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Java集合框架-Collection-List-LinkedList源码
下一篇：密码学 | 多重签名：基于 Schnorr 的 MuSig 方案

从 ES5 到 ES14：深入解析 JavaScript 的演进与特性
本文概述了 JavaScript 从 ES5 到 ES14 的主要特性演进。ES5 引入了严格模式和新的数组方法，提升了代码的安全性和可读性；ES6 带来了 let、const、箭头函数和模块系统等核
阅读更多2024-09-28
为什么不用tensorflow而用opencv
使用 OpenCV 而不是 TensorFlow 进行图像处理和计算机视觉任务的原因取决于特定需求和场景。
阅读更多2024-09-28
“AI大语言模型+”助力大气科学相关交叉领域实践技术应用
GPT生成转化代码，将数据转化为WPS可读取的二进制格式。4.2模型堆叠：使用mlxtend库或自定义方法实现模型堆叠，结合不同模型的预测结果作为新的特征，训练一个新的模型。2.3交叉验证分割：采用交
阅读更多2024-09-28
Apache Solr：深入探索与常见误区解析
Solr 是一个功能丰富且高度可扩展的搜索引擎，适合大规模的数据搜索应用。无论是电商平台的商品搜索、日志分析还是内容管理系统的文章检索，Solr 都能提供高效的解决方案。但是，在使用 Solr 时，配
阅读更多2024-09-28
DataLight（V1.4.5）版本更新，新增 Ranger、Solr
本次更新对平台进行了较多的功能拓展和优化，新增了对 Ranger 和 Solr 服务组件的支持，同时对多项已有功能进行了改进，旨在提升更好的使用体验。进入主节点，通过以下命令启动 Master 进程，
阅读更多2024-09-28
从零开始Ubuntu24.04上Docker构建自动化部署（三）Docker安装Nginx
宿主机上拷贝docker上nginx服务上文件到本地目录。删除docker上nginx容器。停止docker 上nignx。重启启动nginx容器。
阅读更多2024-09-28
付费计量系统通用过程
值得注意的是，虽然每个过程类在普通意义上显示单一，但实际系统的实现通常都有属于同类的几个事例过程。参考条目6和图3，普通。一个过程定义描述的是数据单元或一个事件序列的流程，每一个在系统中都是被定义了的
阅读更多2024-09-28
STM32原理知识查询表
2024.09.27单片机的两种看门狗原理解析
阅读更多2024-09-28
鸿蒙开发（NEXT/API 12）【硬件（常见问题）】驱动开发服务
编译或运行时报错：“usb/usb_ddk_api.h not found”, "hid/hid_ddk_api.h not found" 等
阅读更多2024-09-28
Cilium + ebpf 系列文章- （六）Cilium-BGP与分发-EXTERNAL-IP
CiliumBGPPeerConfig配置对等连接的行为，可以引用一个或多个CiliumBGPAdvertisement资源(使用选择器)1、可以使用CiliumLoadBalancerIPPool来
阅读更多2024-09-28

【大语言模型】如何让ChatGPT等LLM拥有记忆

向量数据库的关键特性

相关文章