向量数据库及其在大模型应用落地中的作用

🕗 发布于 2024-07-21 17:30 数据库 向量数据库解决方案

一、几个术语

需要弄清楚几个术语，比如向量、Embedding、向量检索、向量数据库，具体如下。
1.向量：为AI理解世界的通用数据形式，是多模态数据的压缩，任何模态数据都可以转为向量。文本直接送给计算机是无法认识的，而且是高维数据，需要对其进行向量化处理（即Embedding），处理完成后就形成一个个向量。
2.Embedding：将文字文本转化为保留语义关系的向量文本，相当于利用embedding模型对自然语言的压缩和总结。
3.向量检索：在海量存储的向量中找到最符合要求的Top N个目标。向量搜索是模糊匹配，返回的是相对最符合要求的N个数据，并没有精确标准答案。传统数据库索引是精确匹配。
4.向量数据库：用以高效存储和搜索向量。保证100%信息完整的情况下，通过向量嵌入函数(embedding) 精准描写非结构化数据的特征，从而提供查询、删除、修改、元数据过滤等操作。向量数据库因为可以为大模型提供记忆而需求倍增， AutoGPT更是把对向量数据库需求量推到了更高的水平， AutoGPT从一开始就是采用了OpenAI API+ Pinecone的模式。

二、向量数据库给大模型应用落地带来哪些作用

1.使得大模型具备记忆交互的应用能力

在大模型的应用中，不断涌现出B端对专用数据的需求、 C端对个性化与自动化的需求，带来给大模型增加记忆功能的刚性需求。通过存储增强模型记忆大量的聊天记录或行业知识库，后续在提问时将问题向量化，送入向量数据库中匹配相似的语料作为prompt，向量数据库通过提供记忆能力使prompt更精简和精准，从而使返回结果更精准。
通过语料准备/问题输入/向量检索/prompt优化和结果返回实现基于大模型与向量知识库的问题答复。具体交互流程如下

原文地址：https://blog.csdn.net/hhue2007/article/details/140589383

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：《梦醒蝶飞：释放Excel函数与公式的力量》17.2 工作表函数的高级应用
下一篇：03-用户画像+Elasticsearch

Vue使用代理方式解决跨域问题
如果 Vue 前端应用请求后端 API 服务器，出现跨域问题（CORS），这个问题可以通过 vue.config.js 中的 devServer.proxy 选项来配置。通过使用代理方式解决跨域问题。
阅读更多2024-09-21
[网络层]-IP协议相关特性
不同的子网就是把网络号相同的主机放在一起, 如果在子网中新增一台主机, 则这台主机的网络号和这个子网的网络号一致,但是主机号不能和其他主机的主机号重复,通过合理的设置主机号和网络号,就可以保证在相互连
阅读更多2024-09-21
MySQL篇（存储引擎 - InnoDB存储引擎架构）（持续更新迭代）
MySQL5.5 版本开始，默认使用InnoDB存储引擎，它擅长事务处理，具有崩溃恢复特性，在日常开发中使用非常广泛。下面是InnoDB架构图，左侧为内存结构，右侧为磁盘结构。
阅读更多2024-09-21
ElasticSearch-2-核心语法集群高可用实战-Week2
这里多个文档是指，批量操作多个文档，搜索查询文档将在之后的章节讲解批量获取文档数据是通过_mget的API来实现的。
阅读更多2024-09-21
C#自定义曲线绘图面板
1、显示面板绘制。2、拖动面板，X轴、Y轴都可以拖动。3、显示面板缩放，放大或者缩小。4、鼠标在面板中对应的XY轴数值。5、自动生成的数据数组，曲线显示。6、鼠标是否在曲线上检测。
阅读更多2024-09-21
Web开发之Thymeleaf引擎
模板引擎就是一种用于将动态数据与HTML模板结合，生成最终用户界面的工具，它可以帮助开发者以可维护和结构化的方式创建动态Web页面，模板引擎通常支持数据的动态插入、条件渲染、循环等功能Thymele
阅读更多2024-09-21
【C++】探秘二叉搜索树
二叉搜索树的底层实现
阅读更多2024-09-21
【Linux基础IO】深入Linux文件描述符与重定向：解锁高效IO操作的秘密
在Linux操作系统的广阔世界中，文件描述符（File Descriptor，简称fd）和重定向是理解并高效利用Linux IO（输入/输出）机制的关键基石。它们不仅是系统编程中不可或缺的概念，也是日
阅读更多2024-09-21
Css_动态渐变圆圈旋转效果
【代码】Css_渐变圆圈动态旋转效果。
阅读更多2024-09-21
其他比较条件
NULL条件，包括IS NULL条件和IS NOT NULL条件。空值的意思是难以获得的、未指定的、未知的或者不适用的。示例：查询employees表，找出薪水是5000,6000,8000的雇员ID
阅读更多2024-09-21

向量数据库及其在大模型应用落地中的作用

一、几个术语

二、向量数据库给大模型应用落地带来哪些作用

1.使得大模型具备记忆交互的应用能力

相关文章