LANGUAGE MODELS ARE OPEN KNOWLEDGE GRAPHS
语言模型即开放知识图谱
ABSTRACT
摘要
This paper shows how to construct knowledge graphs (KGs) from pre-trained language models (e.g., BERT, GPT-2/3), without human supervision. Popular KGs (e.g, Wikidata, NELL) are built in eit...
本文展示了如何从预训练语言模型(如BERT、GPT-2/3)中无监督地构建知识图谱(KG)。主流知识图谱(如Wikidata、NELL)通常通过监督或半监督方式构建,依赖人工创建知识。而近期深度语言模型通过预训练从大规模语料中自动获取知识,这些存储的知识提升了语言模型在下游NLP任务(如问答、代码生成和文章撰写)中的表现。本文提出一种无监督方法,将语言模型内蕴的知识转化为知识图谱。研究表明,仅需对预训练语言模型(无需微调)执行一次前向传播即可构建知识图谱。通过与人构建的两个知识图谱(Wikidata、TAC KBP)对比,验证了所构建知识图谱的质量。我们的知识图谱还提供了现有图谱中未涵盖的开放事实知识。代码与知识图谱将公开提供。