[论文翻译]音频驱动头部说话合成的高效情感适应 音频驱动的头部说话合成是虚拟人相关应用的热门研究课题。然而,现有方法的不灵活性和低效率,需要昂贵的端到端训练来将情感从指导视频转移到头部说话的预测,这是很大的限制。在这项工作中,我们提出了音频驱动的说话头的情感适应(EAT)方法,该方法通过参数有效的适应,以经济高效的方式将情感不可知的说话头模型转换为情感可控的模型 ... 由 openoker发布于 2024-05-20 19:08:48 说话人数字人 阅读次数 260