
推荐文章
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]多人三维姿态与形状估计:基于逆向运动学与优化的方法
- [论文翻译]GME: 通过多模态LLMs改进通用多模态检索
- [论文翻译]基于GPT-2模型的提示微调实现翻译后修饰预测
- [论文翻译]代理式上下文工程:为自改进语言模型进化上下文
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]通过层次化关系和常识知识增强场景图生成
- [论文翻译]用紧凑型Transformer (Compact Transformers) 逃离大数据范式
- [论文翻译]扩展通用数据分析智能体 (Data-Analytic Agents)
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域