
推荐文章
- [论文翻译]面向野外单目视频的鲁棒平滑3D多人姿态估计
- [论文翻译]通过层次化关系和常识知识增强场景图生成
- [论文翻译]GME: 通过多模态LLMs改进通用多模态检索
- [论文翻译]状态空间模型遇上Transformer:3D物体检测新范式
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]EA-LSS: 面向3D BEV目标检测的边缘感知Lift-splat-shot框架
- [论文翻译]小数据集上的文本到图像生成数据外推
- [论文翻译]为什么AI智能体是生成式AI的下一个前沿领域
- [论文翻译]输入扰动降低扩散模型的曝光偏差