AI大模型RAG应用_RAG_Prompt
2025-03-24 08:32:39 0 举报
这张 RAG(检索增强生成)应用的工作原理图清晰地展示了其完整的工作流程,主要涵盖数据准备与检索生成两个关键阶段。 在数据准备阶段,首先进行数据提取,从各类数据源中获取原始数据。接着对提取的数据进行分块处理,即将长文本分割成较小的片段,便于后续操作。随后对分块后的数据进行向量化,把文本转换为计算机能够理解的向量形式。最后将向量化后的数据入库存储,为后续的检索提供基础。 在检索生成阶段,当用户提出问题时,先将问题向量化,使其能与已入库的向量数据进行比较。然后根据问题查询匹配数据,找到最相关的数据块。获取这些索引数据后,将其注入到 Prompt 中,为大语言模型(LLM)提供丰富的上下文信息。最终,LLM 依据这些信息生成准确且有针对性的答案。
作者其他创作
大纲/内容
D
Response
1
LLM(s)
完整的RAG应用流程主要包含两个阶段:数据准备阶段:(A)数据提取-> (B) 分块(Chunking)-> (C) 向量化 (embedding)-> (D) 数据入库检索生成阶段:(1)问题向量化-> (2) 根据问题查询匹配数据 ->(3) 获取索引数据 -> (4)将数据注入Prompt -> (5) LLM生成答案
A
Relevant
Embedding
C
Chunking
B
5
Raw Data Sources
Information Extraction
3
Query
2
Retrieval Augmented Generation
Vector Database
4
0 条评论
下一页