[论文翻译]从匹配到生成:生成式信息检索综述
From Matching to Generation: A Survey on Generative Information Retrieval
从匹配到生成:生成式信息检索综述
XIAOXI LI and JIAJIE JIN, Renmin University of China, China YUJIA ZHOU, Tsinghua University, China YUYAO ZHANG and PEITIAN ZHANG, Renmin University of China, China Y...
信息检索 (IR) 系统是用户获取信息的关键工具,长期以来一直由依赖相似性匹配的传统方法主导。随着预训练语言模型的发展,生成式信息检索 (GenIR) 作为一种新范式出现,吸引了越来越多的关注。根据向用户提供信息的形式,当前 GenIR 的研究可分为两个方面:(1) 生成式文档检索 (GR) 利用生成模型的参数记忆文档,无需显式索引即可通过直接生成相关文档标识符实现检索。(2) 可靠响应生成利用语言模型直接生成用户寻求的信息,打破传统 IR 在文档粒度和相关性匹配方面的限制,同时提供灵活性、效率和创造性以满足实际需求。本文旨在系统梳理 GenIR 的最新研究进展。我们将总结 GR 在模型训练与结构、文档标识符、增量学习等方面的进展,以及可靠响应生成在内部知识记忆、外部知识增强等方面的进展。我们还回顾了 GenIR 系统的评估、挑战与未来发展。本综述旨在为研究者提供全面参考,推动 GenIR 领域的进一步发展。[1]