
推荐文章
- [论文翻译]MAFiD: 基于移动平均的融合解码器用于表格和文本数据的问答
- [论文翻译]ClickDiff: 通过点击诱导语义接触图实现基于扩散模型的可控抓取生成
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]面向情感识别的通用视听学习
- [论文翻译]小数据集上的文本到图像生成数据外推
- [论文翻译]MCTrack: 自动驾驶的统一3D多目标跟踪框架
- [论文翻译]基于自上而下与自下而上网络集成的单目3D多人姿态估计
- [论文翻译]面向长尾视觉识别的全局与局部混合一致性累积学习
- [论文翻译]UniTraj: 可扩展车辆轨迹预测的统一框架