[论文翻译]基于GPT-2模型的提示微调实现翻译后修饰预测
翻译后修饰 (PTM) 在调节蛋白质功能和影响细胞过程 (如信号传导、定位和降解) 中起着关键作用。这些生物相互作用的复杂性需要高效的预测方法。在这项工作中,我们引入了 PTMGPT2,这是一种可解释的蛋白质语言模型,它利用基于提示的微调来提高其精确预测 PTM 的准确性。受 GPT 架构最新进展的启发,PTMGPT2 采用无监督学习来识别 PTM。它利用自定义提示来引导模型理解氨基酸序列中编码的微妙语言模式,生成指示 PTM 位点的 Token。为了提供可解释性,我们可视化模型最后解码层的注意力分布,以阐明对分子识别至关重要的序列模体,并分析 PTM 位点处或附近突变的影响,以提供对蛋白质功能的更深入理解。比较评估表明,PTMGPT2 在 19 种 PTM 类型中优于现有方法,突显了其在识别疾病关联和药物靶点方面的潜力...