RAG(检索增强成)
2025-03-25 23:16:54 1 举报
AI智能生成
检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG 能够引入外部知识,从而为大模型在复杂场景中的应用提供更多可能性。
作者其他创作
大纲/内容
1. 概述
定义
检索增强生成(Retrieval Augmented
Generation)
工作机制
信息存储
文档转化为向量形式存储
问题匹配
用户问题向量化并检索匹配内容
答案生成
结合检索内容生成高质量回答
2. 技术复杂性
需技术支持与业务场景优化
文档质量与格式差异显著
不同行业对回答质量需求不同
3. 分块策略
关键作用
决定AI回答精准性与效率
合理分块提升检索与生成效果
分块不当后果
信息割裂
上下文理解偏差
*五种策略
1. 固定大小分块
特性:按照固定字数、词数或标记数(token)进行划分
优势:简单易操作、块大小一致
局限:信息割裂、关键信息分散
适用场景:内容较为零散、不依赖上下文的文档
2. 语义分块
特性:基于内容语义关系进行划分
优势:留语义的自然流畅性,提升检索内容的相关性
局限:需调整相似度阈值,需要设定相似度阈值,需根据文档类型调整
适用场景:具有清晰主题或段落划分的文档
3. 递归分块
特性:基于文档层次结构逐步细分
优势:兼顾文档的自然结构与块大小控制,适用性强,适合多种文档类型
局限:实现复杂度较高,计算量增加
适用场景:具有层次性结构的文档
4. 基于文档结构分块
特性:依据标题、章节或段落等文档结构进行划分
优势:尊重文档逻辑,便于理解与管理,分块边界清晰,适合结构化文档
局限:依赖文档结构清晰度,适用性有限,分块大小可能不均匀,影响处理效率
场景:学术论文、技术文档等结构化文档
5. 基于LLM分块
特性:利用大语言模型(LLM)自动生成分块
优势:分块语义准确性高,内容质量优异,生成效果显著
局限:计算成本高,资源消耗大,长文档处理能力受限
场景:高预算、高质量需求的场景
6. 实践挑战
业务落地需关注技术细节
工具部署仅为起点
需全面优化环节:
信息存储
分块策略
检索与生成
4. 分块策略优化与选择
选择原则
简单高效:固定大小分块适合快速部署
语义深度:语义分块与递归分块适合复杂文档
结构化文档:基于文档结构分块针对性强
高端应用:基于LLM分块适用于高精度需求
优化建议
结合多种策略实验
根据实际需求动态调整

收藏

收藏
0 条评论
下一页