
推荐文章
- [论文翻译]结合 EfficientNet 和 Vision Transformer 进行视频深度伪造检测
- [论文翻译]视觉关系检测中的内部与外部语言知识蒸馏
- [论文翻译]基于渐进式学习的循环通用轮廓实例分割
- [论文翻译]STARS: 面向骨骼序列3D动作识别的自监督调优
- [论文翻译]Pix3D: 单图像3D形状建模数据集与方法
- [论文翻译]迈向可泛化的视觉-语言机器人操作:基准与大语言模型引导的3D策略
- [论文翻译]将视觉语言预训练
- [论文翻译]PAtt-Lite: 轻量级补丁与注意力MobileNet用于挑战性面部表情识别
- [论文翻译]基于Transformer的新型大规模多模态多任务学习网络
- [论文翻译]ARBEx: 基于注意力特征提取与可靠性平衡的鲁棒面部表情学习