
推荐文章
- [论文翻译]Qwen-Audio: 通过统一的大规模音频-语言模型推进通用音频理解
- [论文翻译]TDSM: 零样本动作识别中骨架-文本匹配的三重扩散方法
- [论文翻译]MAFiD: 基于移动平均的融合解码器用于表格和文本数据的问答
- [论文翻译]V2VNet: 面向联合感知与预测的车车通信技术
- [论文翻译]重访牛津与巴黎:大规模图像检索基准测试
- [论文翻译]UniHCP: 以人为本的感知统一模型
- [论文翻译]多人三维姿态与形状估计:基于逆向运动学与优化的方法
- [论文翻译]让不可见变得可见:穿墙与遮挡场景下的动作识别
- [论文翻译]聚焦关键:运用话语连贯理论解决跨文档共指问题
- [论文翻译]可见光-热红外行人重识别的参数共享探索与异质中心三元组损失