[论文翻译]shapiq: 机器学习中的Shapley交互作用
最初源于博弈论的 Shapley 值 (SV) 最近已成为机器学习研究中的重要工具。最值得注意的是,它被用于可解释人工智能中的特征归因和数据估值。Shapley 交互 (SIs) 自然地扩展了 SV 并通过将联合贡献分配给实体组来解决其局限性,从而增强对黑盒机器学习模型的理解。由于计算 SV 和 SI 的指数复杂性,已经提出了各种方法,这些方法利用结构假设或在资源有限的情况下产生概率估计。在这项工作中,我们介绍了 shapiq,这是一个开源 Python 包,它在一个与应用无关的框架中统一了最先进的算法,以高效计算 SV 和任何阶的 SI。此外,它包括一个基准测试套件,其中包含 11 个 SI 的机器学习应用,带有预计算的游戏和真实值,以系统地评估跨领域的计算性能。对于从业者来说,shapiq 能够解释和可视化预测模型中任何阶的特征交互,包括视觉 Transformer、语言模型,以及使用 TreeSHAP-IQ 的 XGBoost 和 LightGBM。通过 shapiq,我们扩展了 shap 的功能,超越了特征归因,并巩固了 SV 和 SI 在机器学习中的应用,促进了未来的研究。源代码和文档可在 https://github.com/mmschlk/shapiq 获取。