
推荐文章
- [论文翻译]Direct3D-S2:基于空间稀疏注意力 (Spatial Sparse Attention) 的十亿级3D生成简易方案
- [论文翻译]跨区域亲和蒸馏在道路标线分割中的应用
- [论文翻译]面向情感识别的通用视听学习
- [论文翻译]Qwen-Audio: 通过统一的大规模音频-语言模型推进通用音频理解
- [论文翻译]全局特征足以胜任图像检索与重排序任务
- [论文翻译]MAFiD: 基于移动平均的融合解码器用于表格和文本数据的问答
- [论文翻译]高效序列转导:联合预测Token与持续时间
- [论文翻译]鲁棒行人搜索预训练的交换路径网络
- [论文翻译]结构化预测中嵌入向量的自动拼接
- [论文翻译]从美学与技术角度探索用户生成内容(UGC)的视频质量评估