跳到主要内容

RAG 知识体系概览

问题

什么是 RAG?RAG 的核心知识体系包含哪些内容?

答案

RAG(Retrieval-Augmented Generation,检索增强生成) 是将外部知识检索与大语言模型生成相结合的技术范式。它解决了 LLM 的核心局限:知识截止、幻觉、领域知识缺乏

一、为什么需要 RAG

问题说明RAG 如何解决
知识截止模型只知道训练数据中的内容实时检索最新文档
幻觉模型可能生成看似正确但错误的内容基于真实文档生成,可引用溯源
领域知识通用模型缺乏企业内部知识接入企业知识库
成本微调成本高、周期长无需训练,数据更新即时生效

二、RAG 核心架构

三、RAG 知识全景

模块核心内容文档
RAG 基础基本架构、Naive RAG 流程RAG 基础架构
文档处理解析、分块、清洗文档处理与分块策略
Embedding文本向量化、模型选择Embedding 与向量化
向量检索向量数据库、索引算法向量检索与数据库
高级检索混合搜索、Query 改写高级检索策略
重排序Cross-Encoder、Reranker重排序与精排
生成与引用Prompt 模板、引用溯源生成策略与引用溯源
评估评估指标、评测框架RAG 评估与优化

四、RAG vs 微调 vs 长上下文

维度RAG微调长上下文
数据更新实时需重新训练每次传入
成本低(检索基础设施)高(GPU 训练)高(Token 费用)
知识量无限(外部存储)有限(模型容量)受窗口限制
准确性可引用溯源可能幻觉可能 Lost in the Middle
适用场景知识库问答、客服风格/格式固化少量文档分析
最佳实践

RAG 和微调可以组合使用:先微调让模型适应领域风格,再通过 RAG 注入实时知识。

五、学习路径


相关链接