[论文翻译]Blended RAG: 通过语义搜索和混合查询检索器提高 RAG (Retriever-Augmented Generation) 的准确性
摘要—检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种常见的方法,通过将私有文档知识库与大语言模型 (LLM) 结合,构建生成式问答 (Generative Q&A) 系统。然而,随着文档库规模的扩大,RAG 的准确性变得越来越具有挑战性,检索器 (Retriever) 在整体 RAG 准确性中扮演着重要角色,它从文档库中提取最相关的文档,为 LLM 提供上下文。在本文中,我们提出了“混合 RAG”方法,利用语义搜索技术(如密集向量索引 (Dense Vector Indexes) 和稀疏编码器索引 (Sparse Encoder Indexes)),并结合混合查询策略。我们的研究在信息检索 (Information Retrieval, IR) 数据集(如 NQ 和 TREC-COVID 数据集)上取得了更好的检索结果,并设定了新的基准。我们进一步将这种“混合检索器”扩展到 RAG 系统中,在生成式问答数据集(如 SQUAD)上展示了显著优于微调性能的结果。