[论文翻译]AU R-CNN: 将专家先验知识编码到R-CNN中以实现动作单元检测
检测人脸动作单元 (Action Units, AUs) 具有挑战性,因为不同动作单元会在多尺度面部区域引发细微的外观变化。现有研究主要通过强调关键区域来识别动作单元,但如何将专家先验知识融入区域定义仍未充分探索,且当前动作单元检测方法尚未结合专家先验知识,通过区域卷积神经网络 (R-CNN) 实现自适应聚焦动作单元相关区域。基于专家先验知识,我们提出新型R-CNN模型AU R-CNN,其核心贡献包括:(1) 直接观测不同动作单元分布的差异化面部区域,通过制定动作单元分区规则将专家先验知识编码至区域定义与兴趣区域 (RoI) 层级标签定义,该设计显著优于现有检测方法;(2) 集成多种动态模型(包括卷积长短期记忆网络、双流网络、条件随机场和时间动作定位网络)并深入分析动态模型的性能成因。