这是最基本的RAG架构。
基本的RAG(Retrieval-Augmented Generation,即检索增强生成)的四个主要限制如下:
- 是否取回:模型可能并不总是决定是否需要取回信息,导致回答不完整。
- 文档相关性:取回的文档可能无法完全回答用户的问题,影响了答案的质量。
- 生成中的幻觉:生成的回答可能包含无关或错误的信息,与检索到的上下文不符。
- 答案相关性:最终答案可能未能直接回应用户的问题,影响了回复的可靠性。
这凸显了保证搜索和准确响应的挑战。
简单来说——我们有一个路由问题和三个评级问题。我们现在来看看如何用自适应RAG与自我反思来解决这四个限制因素?
带有自反思的自适应RAG 是一种动态的检索增强生成(RAG)方法论,其中模型不仅从外部数据源检索相关的信息,还会根据之前的回应来调整和优化其输出。以下是对这个概念的简要说明:
- RAG 概览:在标准 RAG 系统中,语言模型通过检索机制从外部来源(例如文档、数据库)获取相关数据以回答用户查询。这种混合方式使模型能够基于内部知识和检索到的信息生成响应。
- 自我反思:这一概念涉及模型对其输出进行反思,以识别潜在的弱点、差距或误解。通过自我评估其响应的质量,系统可以决定是否需要检索更多信息或重新表述其答案以提高清晰度或准确性。
- 自适应机制:通过自我反思,模型变得具有自适应性,这意味着它可以根据初始响应是否符合用户需求来调整其检索策略。如果模型认为检索到的信息不完整或与查询不符,它可以调整检索参数(例如,检索更多文档或探索不同的来源)。
- 提高准确性:自我反思使系统能够增强其响应的相关性和准确性,提供更丰富、更精确的答案。能够实时动态调整使整个系统更强大和可靠。
自适应的RAG是一种策略技术,将(1)查询分析与(2)主动和自我修正的RAG结合起来。
在该论文paper中,他们报告了查询分析,以实现网络间路由。
- 不检索
- 单次RAG
- 迭代RAG
以下是我们理解上述讨论限制的所有关键点的架构。例如,当用户提出一个问题时——而不是直接进入索引,实际上会进行查询分析,以判断搜索是否与索引相关、无关,还是其他路径。如果问题与索引相关——它将包含检索器、评分模块、答案依据评分器和答案正确性评分器,这些将作为反馈机制,并且在开始时,还有一个路由器来决定进入哪个索引路径。
我们用LangGraph来检查一下。
在我们的实现中,我们将在这两者之间进行路由处理。
- 网络搜索:关于最近事件的问题
- 自我修正的RAG:关于我们索引的问题
请参阅这篇文章来完成代码设置过程。
具有自反思功能的自适应RAG本质上代表了传统RAG的一种进化,通过引入反馈循环来不断优化检索过程和生成的响应,使其更加智能和准确,从而实现了高度的响应性和准确性。
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦