2025年，20个最值得关注的RAG框架，部分开源

分享20个值得关注的RAG框架。检索增强生成（RAG）框架通过整合检索机制与生成模型，有效推动了大型语言模型（LLM）的发展。现在，各界对人工智能解决方案的需求日益旺盛，在 GitHub 上涌现出了诸多开源 RAG 框架，各具特色与功能。知识检索：作为核心功能，它可从外部知识库获取相关信息，为大型语言模型提供必要的上下文支持。生成模型增强：借助检索所得信息对大型语言模型的输入进行优化，促使模型生成

江湖人称麻花滕

3886人浏览 · 2025-01-30 20:12:55

江湖人称麻花滕 · 2025-01-30 20:12:55 发布

分享20个值得关注的RAG框架。

检索增强生成（RAG）框架通过整合检索机制与生成模型，有效推动了大型语言模型（LLM）的发展。

现在，各界对人工智能解决方案的需求日益旺盛，在 GitHub 上涌现出了诸多开源 RAG 框架，各具特色与功能。

RAG 框架主要有以下特性：

知识检索：作为核心功能，它可从外部知识库获取相关信息，为大型语言模型提供必要的上下文支持。
生成模型增强：借助检索所得信息对大型语言模型的输入进行优化，促使模型生成的回复更精准、更具时效性且契合上下文。
多轮交互：凭借此特性，RAG 系统能在与用户的多次交流中细化查询内容并生成新内容，进而提升用户满意度与系统准确性。
模型优化：运用查询消歧、查询抽象和索引优化等多种技术手段，增强 RAG 系统的性能表现。

仅使用 LangChain 为何不可？

虽然 LangChain 使大型语言模型的开发流程得以简化，但也存在一些局限性不得不加以考量。

首先，LangChain 适合初学者快速入门。不过，它存在以下问题：

行为缺乏一致性——LangChain 可能会隐匿重要细节，在生产环境中易引发意外状况。例如，ConversationRetrievalChain 会重新表述输入问题，有时会干扰对话的自然进程。
缺乏标准数据类型——在 LangChain 里，没有统一的数据表示方法，这就导致它与其他框架、工具进行整合时困难重重，在更广泛的机器学习生态系统中操作难度也增加了。
概念和辅助函数复杂——其代码库包含诸多概念以及作为标准 Python 函数包装的“辅助”函数，这让学习和运用它的难度增加了。

相比之下，RAG 则适用于处理复杂和特定领域的查询，具有以下优势：

能够整合外部知识，便于将专业或最新信息融入大型语言模型，这些信息往往不在模型的初始训练数据范围内。
可提高回复的准确性，大幅降低大型语言模型输出中的错误及幻觉现象。
支持定制化需求，能依据特定数据集或知识库对大型语言模型进行定制，生成更贴合特定应用场景的回复。
可提升流程的透明度，能够回溯大型语言模型生成回复所依据的信息源。

这里所说的幻觉现象，是指模型生成的内容与现实情况不相符的情况。

接下来来看看20个热门的 RAG 框架。

这些框架把大型语言模型和外部知识库融合起来，有效提升了所生成内容的准确性与可靠性，在医疗、金融、客户服务、教育等诸多领域都发挥着重要作用，极具应用价值。

1 RAGFlow

网址：https://github.com/infiniflow/ragflow
GitHub 星标：27.1K
具有简化的工作流程设计，配备了预构建组件，且能与向量数据库实现集成。
适合对象：希望快速构建 RAG 应用程序的开发者和组织。
工作流程设计：具有直观的界面，可用于设计和配置 RAG 工作流程。
预配置工作流程：为常见场景提供即用型工作流程。
向量数据库集成：与向量数据库无缝集成，实现高效检索。
应用于聊天机器人和即时问答系统等实时应用程序。
用户友好且高效，降低了学习曲线和开发时间。
社区支持：由于其简单性和有效性，RAGFlow 越来越受欢迎。

2. Haystack

网址：https://github.com/deepset - ai/haystack
GitHub 星标：18.2k
模块化设计，包含文档检索、问答和文本摘要组件。支持多种文档存储解决方案，如 Elasticsearch、FAISS 和 SQL。
适合对象：构建端到端问答和搜索系统的开发者、研究人员和组织。
文档检索：使用各种索引方法高效检索相关文档。
问答：利用预训练语言模型基于检索到的文档生成答案。
文本摘要：提供用于总结大型文档的工具。
在医疗、金融和客户支持等领域广泛用于构建问答系统和搜索引擎。
具有简单的 API 和丰富的文档，非常用户友好，适合初学者和有经验的开发者。
社区支持：Haystack 拥有强大的社区和活跃的开发，确保不断改进和更新。

3 STORM

网址：https://github.com/stanford - oval/storm
GitHub 星标：15.7k
专注于高效的检索机制和生成过程。
适合对象：需要快速、准确的文本检索和响应生成的开发者和组织。
高度可配置的检索：支持多种检索策略和嵌入模型。
优化的生成：与生成模型灵活集成，以提高响应质量。
在在线客户支持和智能助手等方面特别有用。
专为高性能和高效率设计，适用于实时应用程序。
社区支持：注重学术研究和实际应用。

4 LLM - App

网址：https://github.com/pathwaycom/llm - app
GitHub 星标：11.3k
是一个用于文档解析、索引、检索和响应生成的综合工具链。
适合对象：使用大型语言模型构建 RAG 应用程序的企业和开发者。
文档解析：提供解析和预处理文档的工具。
索引：支持多种文档存储解决方案。
检索和生成：集成了高效检索和高质量响应生成模块。
用于法律、医疗和客户服务等领域构建问答系统和搜索引擎。
用户友好，有详细的文档和示例，易于设置和使用。
LLM - App 支持多种语言模型和文档存储解决方案，为 RAG 提供了平衡的方法。

5 txtai

网址：https://github.com/neuml/txtai
GitHub 星标：9.8k
是一个用于语义搜索、语言模型工作流程和文档处理管道的一体化平台。
适合对象：需要为多个 AI 任务提供综合解决方案的组织。
语义搜索：使用嵌入式数据库进行高效的相似性搜索。
语言模型工作流程：易于与各种语言模型和 AI 服务集成。
文档处理：支持多语言和多格式数据。
用于客户服务、内容推荐和数据分析等领域。
高度集成且易于使用，适用于小型和大型项目。
提供详细的文档和示例，帮助用户快速上手。

6 R2R

网址：https://github.com/SciPhi - AI/R2R
GitHub 星标：4.3K
是一个轻量级框架，简化了从检索到响应的过程。
多步检索和生成：优化中间步骤。
支持多种策略：具有灵活的检索和生成选项。
用于聊天机器人和即时问答系统等实时应用程序。
快速高效，适用于实时应用程序。
R2R 旨在降低推理延迟的同时不影响准确性。

7 Cognita

网址：https://github.com/truefoundry/cognita
GitHub 星标：3.5K
专为知识密集型应用程序设计，集成了高效的文档管理和检索机制。
适合对象：处理复杂知识图谱和问答系统的专业人员和组织。
多模态数据支持：处理各种数据类型。
可定制索引：灵活的索引方案。
强大的生成模型：用于生成高质量回复的高级模型。
适用于医疗咨询和法律咨询等应用程序。
可定制且灵活，适合需要深度知识管理的应用程序。
常见用途：Cognita 用于适应性和精度至关重要的大型项目。

8 FlashRAG

网址：https://github.com/RUC - NLPIR/FlashRAG
GitHub 星标：1.6K
针对推理速度进行了优化，采用了各种加速技术。
适合对象：需要实时 RAG 应用程序的开发者和组织。
多种检索模型：支持多种检索模型。
优化的重排序器：用于改进文档排名的算法。
高效生成器：高性能生成模型。
用于需要即时和准确回复的应用程序，如在线客户支持和智能助手。
快速可靠，适用于实时应用程序。
FlashRAG 旨在降低推理延迟的同时不影响准确性。

9 Neurite

网址：https://github.com/satellitecomponent/Neurite
GitHub 星标：1.3K
将神经网络技术与检索机制相结合。
适合对象：需要高精度和高性能的研究人员和组织。
深度学习模型：支持多种神经网络模型。
高效向量检索：针对大型数据集进行了优化。
灵活生成策略：适应性强的生成方法。
在科学研究和数据驱动应用中特别有用。
高精度和高性能，适合高级研究和数据分析。
Neurite 提供了提高检索和生成准确性的高级功能。

10 Canopy

网址：https://github.com/pinecone - io/canopy
GitHub 星标：990
模块化且递归，允许灵活组合组件。
适合对象：需要高度可定制 RAG 系统的开发者和组织。
多步检索和生成：对模型进行递归调用。
可定制组件：能够灵活定制系统。
强大的模型集成：支持广泛的模型。
适用于企业级知识管理系统。
高度模块化且可定制，适合大型项目。
Canopy 旨在处理复杂和动态数据，适用于企业应用程序。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

UFW防火墙安全指南

UFW（Uncomplicated Firewall）是Ubuntu/Debian系统中简化防火墙管理的工具，通过直观命令帮助用户有效控制网络流量，提升系统安全性。文章详细介绍了UFW的基本命令，包括启停防火墙、添加规则、限制连接速率和日志配置等操作，并提供了安全最佳实践，如默认拒绝策略、IP地址限制和服务级规则管理。同时，还涵盖高级配置技巧，例如多网络接口设置、规则优先级调整、IPv6支持及与f