RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前,系统先从外部数据源(如数据库、API或互联网)动态检索相关上下文,再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足

1、 检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息。相关技术:如BM25关键词匹配、密集向量搜索等。

2、 增强器(Augmenter):对检索结果进行筛选、排序和整合,提取最相关的片段。相关技术:上下文重排序、多跳检索。

3、 生成器(Generator):将增强后的上下文与LLM的预训练知识结合,生成自然语言回答。确保回答连贯且忠实于检索内容,避免出现幻觉。

一、RAG范式演进

1、Naive RAG:基础实现

Naive RAG是RAG范式的最初实现,其核心思想是通过简单的关键词检索来增强生成模型的能力。这种方法依赖于TF-IDF、BM25等传统的检索技术,从静态数据集中获取文档,并将其用于生成模型的输入。

优点:

  • 简单易实现:由于依赖简单的关键词匹配,Naive RAG易于实现。

  • 快速部署:适合需要快速上线的场景。

缺点:

  • 缺乏上下文感知:由于仅依赖词汇匹配,无法捕捉查询的语义细微差别。

  • 输出碎片化:生成的响应可能不连贯或过于通用。

  • 可扩展性问题:在处理大规模数据集时表现不佳。

2、Advanced RAG:语义增强

为了克服Naive RAG的局限性,Advanced RAG引入了语义理解和增强的检索技术。Advanced RAG使用密集向量搜索模型(如Dense Passage Retrieval, DPR)和神经排序算法来提高检索的精确度。

关键特性:

  • 密集向量搜索:通过将查询和文档表示在高维向量空间中,实现更好的语义对齐。

  • 上下文重排:使用神经模型重新排序检索到的文档,优先考虑最相关的信息。

  • 多跳检索:支持跨多个文档的推理,适用于复杂查询。

适用场景:

  • 高精度需求:如研究综合和个人化推荐。

3、Modular RAG:模块化设计

Modular RAG代表了RAG范式的最新发展,强调灵活性和定制化。这种系统将检索和生成管道分解为独立的、可重用的组件,允许针对特定领域进行优化和任务适应。

创新点:

  • 混合检索策略:结合稀疏和密集检索方法,以最大化不同查询类型的准确性。

  • 工具集成:可以集成外部API、数据库或计算工具来处理专门任务。

  • 可组合管道:允许独立替换、增强或重新配置检索器、生成器和其他组件。

适用场景:

  • 复杂多领域任务:如金融分析和个性化推荐。

4、Graph RAG:图结构整合

Graph RAG通过整合图结构数据来扩展传统的RAG系统。这些系统利用图数据中的关系和层次结构来增强多跳推理和上下文丰富。

特点:

  • 节点连接性:捕捉实体之间的关系。

  • 层次知识管理:通过图结构处理结构化和非结构化数据。

  • 上下文丰富:通过图路径增加关系理解。

适用场景:

  • 结构化数据任务:如医疗诊断和法律研究。

5、Agentic RAG:自主代理

Agentic RAG代表了一种范式转变,通过引入能够动态决策和优化工作流的自主代理来实现更高层次的灵活性和适应性。与静态系统不同,Agentic RAG采用迭代细化和自适应检索策略来处理复杂的实时和多领域查询。

关键特性:

  • 自主决策:代理根据查询复杂性独立评估和管理检索策略。

  • 迭代细化:通过反馈循环提高检索准确性和响应相关性。

  • 工作流优化:动态协调任务,提高实时应用的效率。

适用场景:

  • 动态适应性强:如客户支持和财务分析。

二、Agentic RAG

Agentic RAG概览

1、Agentic RAG的核心模式

1、 反思

定义:智能体评估自己的决策和输出,识别错误和需要改进的领域。

主要优势:

  • 启用迭代结果改进。

  • 提高多步推理任务的准确性。

示例:在医疗诊断系统中,智能体根据检索到的数据进行迭代反馈,以完善诊断。

2、 规划

定义:智能体创建结构化的工作流和任务序列,以高效解决问题。

主要优势:

  • 通过分解任务,促进多步推理。

  • 通过优化任务优先级,减少计算开销。

示例:金融分析系统规划数据检索任务,以评估风险并提供建议。

3、工具使用

定义:智能体与外部工具、API和知识库交互,以检索和处理数据。

主要优势:

  • 扩展系统的能力,超越预训练知识。

  • 通过整合外部资源,实现特定领域的应用。

示例:法律助理智能体从合同数据库中检索条款,并应用特定领域的规则进行合规性分析。

4、 多智能体协作

定义:多个智能体协作,通过分工和共享信息及结果来解决复杂任务。

主要优势:

  • 高效处理大规模和分布式问题。

  • 结合专业智能体的能力,获得更好的结果。

示例: 在客户支持中,智能体协作以从常见问题解答(FAQ)中检索知识、生成响应并提供后续服务。 LawGlance通过利用多智能体工作流简化法律研究,检索相关文件,分析信息,并提供精确的法律见解。它整合了Crew AI、LangChain和Chroma,以检索法律文件、进行网络搜索,并提供针对用户查询的简洁、准确的答案。

小结:这些模式构成了Agentic RAG系统的核心,使它们能够动态适应任务需求,通过自我评估改进决策,利用外部资源进行特定领域的推理,通过协作处理复杂、分布式的工作流。

三、Agentic RAG系统的分类

Agentic检索增强型生成(RAG)系统涵盖了各种架构和工作流,每种都针对特定任务和复杂程度进行了定制。

1、 单智能体RAG

核心思想:由单个自主智能体管理检索和生成过程。

工作流程

  1. 向智能体提交查询。

  2. 智能体从外部来源检索相关数据。

  3. 对数据进行处理并合成回复。

优点

  • 对于基本用例,架构简单。

  • 易于实现和维护。

局限性

  • 可扩展性有限。

  • 对于多步推理或大型数据集效果不佳。

2、 多智能体RAG

核心思想:一组智能体协作执行复杂的检索和推理任务。

工作流程

  1. 智能体动态划分任务(例如,检索、推理、合成)。

  2. 每个智能体专门负责特定的子任务。

  3. 将结果汇总并合成为连贯的输出。

优点

  • 对于分布式、多步任务表现更佳。

  • 模块化程度更高,可扩展性更强。

局限性

  • 随着智能体数量的增加,协调复杂度上升。

  • 智能体之间存在冗余或冲突的风险。

3、 分层智能体RAG

核心思想:将智能体组织成层次结构,以便更好地进行任务优先级排序和委派。

工作流程

  1. 顶层智能体在较低层级智能体之间协调子任务。

  2. 每个较低层级智能体处理流程中的特定部分。

  3. 结果在较高层级迭代优化并整合。

优点

  • 对于大型复杂任务具有可扩展性。

  • 模块化设计便于实现专业化。

局限性

  • 需要复杂的协调机制。

  • 在层级结构的较高层级可能出现瓶颈。

4、纠错智能体RAG

核心思想:通过反馈循环使智能体能够迭代评估和优化其输出。

工作流程

  1. 智能体生成初始回复。

  2. 一个评判模块评估回复是否存在错误或不一致之处。

  3. 智能体根据反馈优化回复。

  4. 重复步骤2 - 3,直到输出达到质量标准。

优点

  • 通过迭代改进实现高准确性和可靠性。

  • 对于容易出错或高风险任务很有用。

局限性

  • 计算开销增加。

  • 反馈机制必须精心设计,以避免无限循环。

5、 自适应智能体RAG

核心思想:根据任务要求动态调整检索策略和工作流程。

工作流程

  1. 智能体评估查询及其上下文。

  2. 根据可用数据和用户需求实时调整检索策略。

  3. 使用动态工作流程合成回复。

优点

  • 对于各种任务和动态环境具有高度灵活性。

  • 提高上下文相关性和用户满意度。

局限性

  • 设计强大的自适应机制具有挑战性。

  • 实时调整会带来计算开销。

6、 基于图的智能体RAG

基于图的RAG系统通过整合基于图的数据结构进行高级推理,扩展了传统的RAG。

6.1 Agent - G:用于图RAG的智能体框架

核心思想:使用图知识库和反馈循环,动态地将任务分配给专门的智能体。

工作流程

  1. 从图知识库中提取关系(例如,疾病与症状的映射)。

  2. 用来自外部来源的非结构化数据进行补充。

  3. 使用评判模块验证结果并迭代改进。

优点

  • 结合了结构化和非结构化数据。

  • 对于复杂任务具有模块化和可扩展性。

  • 通过迭代优化确保高准确性。

6.2 GeAR:用于RAG的图增强智能体

核心思想:通过图扩展技术和基于智能体的架构增强RAG系统。

工作流程

  1. 扩展与查询相关的图,以更好地理解关系。

  2. 利用专门的智能体进行多跳推理。

  3. 将图结构和非结构化信息合成为回复。

优点

  • 在多跳推理场景中表现出色。

  • 提高深度上下文任务的准确性。

  • 能够动态适应复杂的查询环境。

7、 智能体文档工作流(ADW)

智能体文档工作流(ADW)通过利用智能体自动化以文档为中心的流程,对传统的检索增强生成(RAG)系统进行了扩展。

工作流程

1、 文档解析与结构化: 从诸如发票或合同等文档中提取结构化数据。

2、 状态维护:在多步骤工作流中跟踪上下文,以确保一致性。

3、 知识检索: 从外部来源或特定领域的数据库中检索相关参考信息。

4、 智能体编排: 应用业务规则,进行多步推理,并协调外部应用程序编程接口(API)。

5、 可执行输出生成:生成针对特定用例定制的结构化输出(例如,报告或摘要)。

四、智能体RAG框架的对比分析

传统RAG、智能体RAG以及智能体文档工作流(ADW)。该分析突出了它们各自的优势、劣势及最适用场景,为其在各种不同用例中的适用性提供了宝贵见解。

关键要点
  • 传统RAG最适合需要基本检索和生成能力的较简单任务。

  • 智能体RAG在多智能体协作推理方面表现出色,适用于更复杂的多领域任务。

  • 智能体文档工作流(ADW) 为企业级应用(如合同分析和发票处理)提供定制化的、以文档为中心的解决方案。

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐