RAG检索增强生成流程图
2024-11-22 14:47:02 6 举报
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索技术与语言生成模型的人工智能技术。RAG技术旨在解决大型语言模型(LLM)在处理知识密集型任务时面临的挑战,如幻觉问题(即生成看似逻辑严谨但缺乏事实依据的输出)和知识中断问题(即模型返回的信息与训练数据相比过时)。通过引入外部知识库,RAG技术能够增强LLM的生成能力,使其能够生成更准确、更丰富的文本内容。
作者其他创作
大纲/内容
向量检索
TF-IDF Encodings
Question Vector
向量化
Private knowledge base
Prompt + Relevant Chunks + Question请求LLM
Document chunks
召回知识片段
Top K Rerank Chunks
Chat Interface
Embedding Model
全文检索
输入
TF-IDF
Question
TF-IDF Index
输出
Answer
LLM
Embeddings
Vector Database
切片
0 条评论
下一页