[论文翻译]PIKE-RAG: 专业化知识和推理增强生成
尽管检索增强生成(Retrieval-Augmented Generation, RAG)系统通过外部检索扩展了大语言模型(LLM)的能力,并取得了显著进展,但这些系统往往难以满足现实工业应用中复杂多样的需求。仅依赖检索被证明不足以从专业语料库中提取深层次的领域知识并进行逻辑推理。为此,我们提出了sPecIalized KnowledgE and Rationale Augmentation Generation (PIKE-RAG),专注于提取、理解和应用专门知识,同时构建连贯的推理过程,逐步引导LLM生成准确的响应。认识到工业任务的多样化挑战,我们引入了一种新范式,基于知识提取和应用的复杂性对任务进行分类,从而系统评估RAG系统解决问题的能力。这一战略方法为RAG系统的分阶段开发和增强提供了路线图,以适应工业应用不断变化的需求。此外,我们提出了知识原子化和知识感知的任务分解方法,分别基于原始查询和累积的知识,有效地从数据块中提取多方面的知识,并迭代地构建推理过程,在各种基准测试中展示了卓越的性能。代码已公开在https://github.com/microsoft/PIKE-RAG。