[论文翻译]AniPortrait:音频驱动的真实肖像动画合成 在这项研究中,我们提出了 AniPortrait,这是一种新颖的框架,用于生成由音频和参考肖像图像驱动的高质量动画。我们的方法分为两个阶段。最初,我们从音频中提取 3D 中间表示并将其投影到一系列 2D 面部标志中 ... 由 openoker发布于 2024-05-20 19:44:20 音频数字人 阅读次数 330
[论文翻译]音频驱动头部说话合成的高效情感适应 音频驱动的头部说话合成是虚拟人相关应用的热门研究课题。然而,现有方法的不灵活性和低效率,需要昂贵的端到端训练来将情感从指导视频转移到头部说话的预测,这是很大的限制。在这项工作中,我们提出了音频驱动的说话头的情感适应(EAT)方法,该方法通过参数有效的适应,以经济高效的方式将情感不可知的说话头模型转换为情感可控的模型 ... 由 openoker发布于 2024-05-20 19:08:48 说话人数字人 阅读次数 234
[论文翻译]Talking Head 单图像动画4:改进模型及其提炼 我们研究创建可以从动漫角色的单个图像实时控制的角色模型的问题。这个问题的解决方案将大大降低创建头像、电脑游戏和其他交互式应用程序的成本… 由 openoker发布于 2024-05-20 19:07:32 动漫角色数字人 阅读次数 307