
推荐文章
- [论文翻译]基于图卷积网络的动态场景理解
- [论文翻译]Qwen-Audio: 通过统一的大规模音频-语言模型推进通用音频理解
- [论文翻译]面向情感识别的通用视听学习
- [论文翻译]重访牛津与巴黎:大规模图像检索基准测试
- [论文翻译]HAMLET:一种基于分层多模态注意力机制的人类活动识别算法
- [论文翻译]UniHCP: 以人为本的感知统一模型
- [论文翻译]基于任务特定预训练的少样本命名实体识别多任务语义分解框架
- [论文翻译]ClickDiff: 通过点击诱导语义接触图实现基于扩散模型的可控抓取生成
- [论文翻译]包含51种类型多样语言的百万示例多语言自然语言理解数据集
- [论文翻译]TS-SEP:基于估计说话人嵌入的联合二值化与分离