Invar-RAG：基于不变性对齐的LLM检索方法提升生成质量

🕗 发布于 2024-11-15 09:56 人工智能 RAG 大模型

Invar-RAG：基于不变性对齐的LLM检索方法提升生成质量

论文链接:https://arxiv.org/html/2411.07021v1

论文概述

在检索增强型生成（Retrieval-Augmented Generation, RAG）系统中直接应用大型语言模型（Large Language Models, LLMs）时面临的挑战。具体来说，论文关注以下几个问题：

特征局部性问题（Feature Locality Problem）：由于大型语言模型的庞大参数知识库阻碍了有效使用所有语料库中的全局信息，例如，基于LLM的检索器通常输入文档的摘要而不是整个文档，这可能导致无法充分利用全局信息。
检索方差问题（Retrieval Variance）：由于大型语言模型固有的生成不一致性属性，当前基于LLM的检索可能会产生不可预见的方差，尤其是在输入查询或上下文大小变化时，直接导致不理想且易受攻击的性能。
检索器与生成模型的分离问题：在RAG系统中，检索器和生成模型之间的分离阻碍了它们的完全集成，限制了它们在下游应用中的兼容性。

为了解决这些问题，论文提出了一个名为Invar-RAG的新颖两阶段微调架构，包括检索阶段和生成阶段。在检索阶段，通过整合基于LoRA的表示学习来解决特征局部性问题，并开发了两种模式（即不变模式和变体模式）以及不变损失来减轻LLM中的方差。在生成阶段，设计了一种精心设计的微调方法，以改进LLM，以便根据检索到的信息准确生成答案。实验结果表明，Invar-RAG在三个开放域问答（Open-domain Question Answering, ODQA）数据集上显著优于现有基线

核心内容

论文提出了一个名为Invar-RAG的新型两阶段微调架构来解决上述问题，具体方法如下：

检索阶段（Retrieval Stage）

1. LLM-based Retriever：

使用基于LLaMA的双编码器架构作为检索器的骨干网络。
引入了LLM-aligned Retrieval，通过小语言模型（MiniLM）将输入查询和文档表示为高维空间中的向量，然后通过KL散度构建的新损失函数将这些粗略的查询-文档对表示与LLM的表示空间对齐。

2. 表示学习（Representation Learning）：

利用LoRA（Low-Rank Adaptation）架构为原始表示添加额外的适配参数，以增强检索器返回相关文档的能力。

3. 不变性损失（Invariance Loss）：

通过识别对性能贡献最大的不变模式，并逐渐迫使模型依赖于这些不变模式，减少实践中不可预见的方差，增强RAG系统的鲁棒性。

生成阶段（Generation Stage）

1. 生成能力优化：

在检索到相关信息后，通过特殊设计的微调示例来优化LLM，使其能够更准确地回答给定问题。

2. 微调方法：

冻结先前微调的权重，并优化生成函数，允许LLM根据检索到的文档给出正确答案。

论文总结

Invar-RAG框架：提出了一个新颖的框架，包含两个阶段的微调方法，分别针对检索和生成。
LLM-based检索方法：提出了一种新的基于LLM的检索方法，包括表示学习和不变性损失，分别解决特征局部性和检索方差问题。
性能验证：在三个公共ODQA数据集上验证了Invar-RAG的性能，无论在检索性能还是生成性能上，都展示了其优越性。

通过这些方法，Invar-RAG能够有效地利用LLM的语义理解能力来检索相关信息，并生成准确的答案，同时解决了特征局部性和检索方差的问题。

编者简介

致Great,中国人民大学硕士，多次获得国内外算法赛奖项，目前在中科院计算所工作，目前负责大模型训练优化以及RAG框架开发相关工作。

个人主页：https://github.com/yanqiangmiffy

项目链接：https://github.com/gomate-community/GoMate

原文地址：https://blog.csdn.net/yanqianglifei/article/details/143774857

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：AR眼镜方案_AR智能眼镜阵列/衍射光波导显示方案
下一篇：决策树基本 CART Python手写实现

解决 Spring Boot 中 `Ambiguous mapping. Cannot map ‘xxxController‘ method` 错误
在使用 Spring Boot 开发 Web 应用时，经常会遇到各种各样的错误。其中一种常见的错误是。本文将详细介绍这个错误的原因及解决方法，帮助开发者快速定位并解决问题。解决错误的关键在于确保每个方
阅读更多2024-11-15
数据分析案例-笔记本电脑价格数据可视化分析
本实验数据集来源于Kaggle，原始数据集共有1303条数据，13个变量，各变量含义如下：0 laptop_ID-数字-产品ID1 Company-字符串-笔记本电脑制造商2 Product-字符串-
阅读更多2024-11-15
Linux 如何查看当前系统版本的详细信息？
系统中基本都存在，所以是一种标准的获取系统信息的方式。命令以标准的方式提供详细的发行版信息。发行版的说明文件一般位于。
阅读更多2024-11-15
初级数据结构——栈
数据结构栈（Stack）是一种线性的数据结构，它只允许在序列的一端（称为栈顶）进行插入和删除操作。这种特性使得栈成为许多算法和问题解决中的有力工具。栈是一种简单而强大的数据结构，它遵循后进先出的原则，
阅读更多2024-11-15
网络安全练习之 ctfshow_web
根据前面得到的qq邮箱中的qq号查询用户，目前电脑版的QQ添加好友好像不能查看详细信息，手机版的可以看到对方所在地为陕西西安。路径是：/editor/attached/file/tmp/html/no
阅读更多2024-11-15
Python 三种方式实现自动化任务
本文介绍了用Python实现机器人过程自动化的三个包，方便读者选择、对比学习。
阅读更多2024-11-15
C++基础：Pimpl设计模式的实现
PIMPL （ Private Implementation 或 Pointer to Implementation ）是通过一个私有的成员指针，将指针所指向的类的内部实现数据进行隐藏。
阅读更多2024-11-15
【flutter】flutter2升级到3.
以这个 https://github.com/aa286211636/Flutter_QQ 为例子，升级下看看。只有登录界面能正常显示，别的页面都是报错。flutter这版本变动，基本不能直接ru
阅读更多2024-11-15
【JAVA毕业设计】基于Vue和SpringBoot的宠物咖啡馆平台
基于Vue.js和SpringBoot的宠物咖啡馆平台是一个综合性的在线服务系统，旨在为宠物爱好者提供一个便捷的宠物护理和社交场所。该平台分为管理后台和用户网页端，以满足不同用户群体的需求。管理后台主
阅读更多2024-11-15
认证鉴权框架SpringSecurity-2--重点组件和过滤器链篇
这4个接口中，每一个都是当认证或者授权过程中发生结果后触发，可以是失败的场景也可以是成功后触发。1个成功后执行，3个为失败后促发执行。
阅读更多2024-11-15