
推荐文章
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]通过层次化关系和常识知识增强场景图生成
- [论文翻译]HAMLET:一种基于分层多模态注意力机制的人类活动识别算法
- [论文翻译]高效遥感:基于统一迁移学习与模态对齐的方法
- [论文翻译]基于概率比率割优化的深度聚类
- [论文翻译]可见光-热红外行人重识别的参数共享探索与异质中心三元组损失
- [论文翻译]面向野外单目视频的鲁棒平滑3D多人姿态估计
- [论文翻译]EA-LSS: 面向3D BEV目标检测的边缘感知Lift-splat-shot框架
- [论文翻译]emoDARTS: 联合优化CNN与序列神经网络架构以实现卓越的语音情感识别
- [论文翻译]ClickDiff: 通过点击诱导语义接触图实现基于扩散模型的可控抓取生成