GlobeDiff:多智能体系统中部分可观测性的状态扩散过程
在多智能体系统的领域中,\emph{部分可观测性}的挑战是有效协调和决策的一个关键障碍。现有的方法,如信念状态估计和智能体间通信,往往不够完善。基于信念的方法受限于其对过去经验的关注,而没有充分利用全局信息,而通信方法通常缺乏一个鲁棒的模型来有效地利用它们提供的辅助信息。为了解决这个问题,我们提出了全局状态扩散算法(Global State Diffusion Algorithm,简称GlobeDiff),以基于局部观测来推断全局状态。通过将状态推断过程形式化为一个多模态扩散过程,GlobeDiff克服了状态估计中的模糊性,同时以高保真度推断全局状态。我们证明,在单模态和多模态分布下,GlobeDiff的估计误差均可被界定。大量的实验结果表明,GlobeDiff实现了优越的性能,并且能够准确推断全局状态。
赞
评论
请
登录后发表观点
