登录免费注册

首页  思维导图  详情

RAG（检索增强成）

2025-03-25 23:16:54   1  举报





AI智能生成

检索增强生成（RAG，Retrieval-Augmented Generation）技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力，RAG 能够引入外部知识，从而为大模型在复杂场景中的应用提供更多可能性。

LangChain

Python

RAG

作者其他创作

大纲/内容

1. 概述

定义

检索增强生成（Retrieval Augmented Generation）

工作机制

信息存储

文档转化为向量形式存储

问题匹配

用户问题向量化并检索匹配内容

答案生成

结合检索内容生成高质量回答

2. 技术复杂性

需技术支持与业务场景优化

文档质量与格式差异显著

不同行业对回答质量需求不同

3. 分块策略

关键作用

决定AI回答精准性与效率

合理分块提升检索与生成效果

分块不当后果

信息割裂

上下文理解偏差

*五种策略

1. 固定大小分块

特性：按照固定字数、词数或标记数（token）进行划分

优势：简单易操作、块大小一致

局限：信息割裂、关键信息分散

适用场景：内容较为零散、不依赖上下文的文档

2. 语义分块

特性：基于内容语义关系进行划分

优势：留语义的自然流畅性，提升检索内容的相关性

局限：需调整相似度阈值，需要设定相似度阈值，需根据文档类型调整

适用场景：具有清晰主题或段落划分的文档

3. 递归分块

特性：基于文档层次结构逐步细分

优势：兼顾文档的自然结构与块大小控制，适用性强，适合多种文档类型

局限：实现复杂度较高，计算量增加

适用场景：具有层次性结构的文档

4. 基于文档结构分块

特性：依据标题、章节或段落等文档结构进行划分

优势：尊重文档逻辑，便于理解与管理，分块边界清晰，适合结构化文档

局限：依赖文档结构清晰度，适用性有限，分块大小可能不均匀，影响处理效率

场景：学术论文、技术文档等结构化文档

5. 基于LLM分块

特性：利用大语言模型（LLM）自动生成分块

优势：分块语义准确性高，内容质量优异，生成效果显著

局限：计算成本高，资源消耗大，长文档处理能力受限

场景：高预算、高质量需求的场景

6. 实践挑战

业务落地需关注技术细节

工具部署仅为起点

需全面优化环节：

信息存储

分块策略

检索与生成

4. 分块策略优化与选择

选择原则

简单高效：固定大小分块适合快速部署

语义深度：语义分块与递归分块适合复杂文档

结构化文档：基于文档结构分块针对性强

高端应用：基于LLM分块适用于高精度需求

优化建议

结合多种策略实验

根据实际需求动态调整

 收藏

立即使用

RAG（检索增强成）

 收藏

立即使用

规则保存流程

一直小蚂蚁吆

职业：暂无













评论

0 条评论

下一页

为你推荐

查看更多



RAG知识库业务架构图

检索增强生成RAG架构图

RAG整体架构 · 流程架构

RAG检索增强生成 · 知识库问答

RAG检索增强生成 · 知识库问答

基于大模型的知识图谱检索增强

基于RAG技术的推荐理由生成

RAG混合检索技术方案图

RAG检索增强生成技术架构



图形选择

思维导图

主题

补充说明

AI生成





修改AI描述

去编辑

重新生成

提示 

关闭后当前内容将不会保存，是否继续？

取消

确定