AI大模型-提示工程学习笔记12-检索增强生成(RAG)

🕗 发布于 2025-01-22 16:55 学习笔记 人工智能 提示工程 ai

卷首语：我所知的是我自己非常无知，所以我要不断学习。

写给AI入行比较晚的小白们（比如我自己）看的，大神可以直接路过无视了。

检索增强生成（RAG） 是一种结合检索（Retrieval）和生成（Generation）的技术，旨在通过从外部知识库中检索相关信息，增强大语言模型（LLM）的生成能力。这种方法特别适合需要实时更新知识或依赖外部信息的任务，例如问答系统、文档生成和知识密集型任务。

1. 核心思想

(1) 传统生成模型的局限性

大语言模型（如 GPT 系列）在生成内容时依赖于其训练数据。
由于训练数据是静态的，模型可能缺乏最新的知识或特定领域的专业信息。
例如，模型可能无法回答关于最新事件的问题，或者在特定领域（如医学、法律）中生成准确的答案。

(2) RAG 的解决方案

RAG 通过将生成模型与检索模块结合，弥补了生成模型的知识盲点。
在生成答案之前，RAG 会从外部知识库（如文档数据库、搜索引擎、维基百科）中检索相关信息，并将这些信息作为上下文提供给生成模型。
生成模型利用检索到的信息生成更准确、更相关的答案。

2. 工作流程

RAG 的工作流程可以分为以下几个步骤：

(1) 输入问题

用户输入一个问题或任务，例如：

(2) 检索相关信息

检索模块从外部知识库中检索与问题相关的信息。
例如，检索到以下信息：

(3) 整合上下文

将检索到的信息与用户输入的问题整合，作为生成模型的输入。
例如：

(4) 生成答案

生成模型根据输入生成答案：

3. 两种主要架构

RAG 的实现通常有两种主要架构：

(1) 检索-后生成（Retrieve-then-Generate）

流程：
1. 检索模块从知识库中检索相关信息。
2. 将检索到的信息作为上下文输入生成模型。
3. 生成模型根据上下文生成答案。
优点：
1. 简单易实现。
2. 检索到的信息直接用于生成答案，增强了生成的准确性。
缺点：
1. 如果检索到的信息不相关或不完整，可能会影响生成质量。

(2) 检索-生成融合（Retrieve-and-Generate Fusion）

流程：
1. 检索模块从知识库中检索多个相关信息。
2. 生成模型将所有检索到的信息作为输入，并融合这些信息生成答案。
优点：
1. 可以综合多个信息源，生成更全面的答案。
缺点：
1. 需要更复杂的模型架构和更高的计算资源。

4. 优势所在

(1) 实时更新知识

RAG 可以从外部知识库中检索最新的信息，弥补生成模型知识库的静态性。
例如，回答关于最新事件的问题：

(2) 提高生成的准确性

通过检索相关信息，RAG 可以为生成模型提供更准确的上下文，从而提高生成内容的质量。
例如，在医学或法律领域，RAG 可以检索专业文献，生成更可靠的答案。

(3) 适应特定领域任务

RAG 可以通过定制化的知识库（如企业内部文档、行业数据库）适应特定领域的任务。
例如，回答企业内部的技术问题或生成行业报告。

(4) 增强模型的可解释性

RAG 的生成过程可以追溯到检索到的信息来源，从而增强模型的可解释性。
用户可以查看生成答案所依据的信息，验证其可靠性。

5. 局限性

尽管 RAG 有许多优势，但它也存在一些局限性：

(1) 检索模块的依赖

RAG 的性能高度依赖于检索模块的质量。
如果检索到的信息不相关或不准确，可能会导致生成错误的答案。

(2) 知识库的维护成本

RAG 需要一个高质量的知识库作为信息来源。
知识库需要定期更新和维护，以确保信息的准确性和时效性。

(3) 计算成本较高

RAG 的流程包括检索和生成两个阶段，计算成本较高，尤其是在处理大规模知识库时。

(4) 信息整合的复杂性

当检索到的信息较多时，如何有效整合这些信息并生成高质量的答案是一个挑战。
如果信息之间存在矛盾，可能会影响生成的准确性。

6. 应用场景

RAG 技术适用于以下场景：

(1) 问答系统

通过检索外部知识库，回答用户的问题。
例如：企业内部问答系统、客户支持系统。

(2) 文档生成

根据用户输入和检索到的信息，生成高质量的文档。
例如：生成行业报告、技术文档。

(3) 知识密集型任务

在医学、法律、金融等领域，利用专业知识库生成准确的答案。
例如：医学诊断、法律咨询。

(4) 实时信息获取

回答关于最新事件或动态的问题。
例如：新闻问答、市场动态分析。

7. 实现技术

RAG 的实现通常包括以下技术组件：

(1) 检索模块

检索模块负责从知识库中检索相关信息。
常用技术包括：
- 向量检索：将问题和知识库中的文档表示为向量，通过相似度计算检索相关文档。
- 传统检索方法：如 TF-IDF、BM25。

(2) 生成模块

生成模块负责根据检索到的信息生成答案。
常用技术包括：
- 大语言模型：如 GPT-3、GPT-4。
- 微调模型：对生成模型进行微调，以适应特定领域任务。

(3) 知识库

知识库是 RAG 的信息来源，可以是：
- 开放知识库：如维基百科、PubMed。
- 定制知识库：如企业内部文档、行业数据库。

8. 未来发展方向

(1) 动态知识库

开发能够实时更新的知识库，确保检索到的信息始终是最新的。

(2) 更高效的检索技术

优化检索模块的性能，提高检索速度和准确性。
例如，使用更高效的向量检索算法。

(3) 信息整合与冲突解决

开发更智能的信息整合技术，解决检索到的信息之间的冲突。

(4) 与多模态技术结合

将 RAG 扩展到多模态任务，例如结合图像、音频等信息生成答案。

(5) 增强的可解释性

提供更详细的生成过程和信息来源，增强用户对生成内容的信任。

检索增强生成（RAG）是一种强大的技术，通过结合检索和生成的能力，弥补了大语言模型的知识盲点。它的核心优势在于：

实时更新知识。
提高生成的准确性。
适应特定领域任务。

尽管 RAG 面临一些挑战（如检索质量、知识库维护成本），但它在问答系统、文档生成和知识密集型任务中的应用潜力巨大。未来，随着检索技术和生成模型的不断进步，RAG 有望在更多领域发挥重要作用。

原文地址：https://blog.csdn.net/972301/article/details/145281825

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：江天科技主要产品销售单价下滑，应收账款、存货周转率大幅下降
下一篇：SQLmap 自动注入 -02

Android系统开发（十九）：无缝拉伸的艺术——9-Patch 可绘制对象详解
这些案例展示了 9-Patch 在不同场景中的实际应用。通过灵活定义拉伸和内容区域，9-Patch 帮助开发者轻松实现高质量的 UI 适配效果。在项目中，这种技术能显著提升界面美观度和用户体验，堪称
阅读更多2025-01-22
简识Redis 持久化相关的 “Everysec“ 策略
另外，Redis 还提供了 "No" 策略（由操作系统决定何时同步），但这种策略在数据安全性方面存在较大的风险，通常不建议在生产环境中使用。在 Redis 的持久化机制中，&quo
阅读更多2025-01-22
14 常用的负载均衡算法
像我之前做过的互联网广告平台，对请求响应时间要求非常高，为了解决南北方网络延迟的问题，在不同的区域部署了不同的IDC机房，请求通过域名访问后，会判断落到哪个IP响应时间短后续该ip的请求就会落到不同I
阅读更多2025-01-22
MySQL为什么使用B+树？B+树和B树的区别
MySQL为什么使用B+树？B+树和B树的区别
阅读更多2025-01-22
QT的d指针和p指针
QT的d指针和p指针
阅读更多2025-01-22
有了TiDB，是否还需要“散装”大数据组件？
虽然TiDB提供了强大的分布式数据处理能力，但在面对。
阅读更多2025-01-22
7、数组知识点汇总
7、数组知识点汇总
阅读更多2025-01-22
安装第三方库到指定目录出现问题
从你的输出来看，安装过程似乎在尝试更新文件时遇到了权限问题。这个文件通常用于记录安装过程中创建或更新的文件列表，以便于后续的卸载或其他操作。即使你之前设置了自定义的（如），仍然会被写入构建目录（在这个
阅读更多2025-01-22
【真机调试】前端开发：移动端特殊手机型号有问题，如何在电脑上进行调试？
edge浏览器谷歌浏览器（开tizi）希望我的分享能够帮助到更多的人，如果觉得我的分享有帮助的话，请大家一键三连支持一下哦~❤️原创不易，期待你的关注与支持~😊之后我会继续更新前端学习小知识，关注我不
阅读更多2025-01-22
bundletool来特定设备规范的json安装aab包
java -jar ./bundletool.jar build-apks --device-spec=j:/device-spec.json --bundle=app-dev-release.aab
阅读更多2025-01-22