
推荐文章
- [论文翻译]HAMLET:一种基于分层多模态注意力机制的人类活动识别算法
- [论文翻译]Qwen-Audio: 通过统一的大规模音频-语言模型推进通用音频理解
- [论文翻译]面向情感识别的通用视听学习
- [论文翻译]基于Conformer的连续语音分离
- [论文翻译]V2VNet: 面向联合感知与预测的车车通信技术
- [论文翻译]ClickDiff: 通过点击诱导语义接触图实现基于扩散模型的可控抓取生成
- [论文翻译]TAT-QA: 金融领域表格与文本混合内容问答基准
- [论文翻译]FunASR: 端到端语音识别基础工具包
- [论文翻译]提升时序动作定位:采用循环机制的高级S6建模
- [论文翻译]聚焦关键:运用话语连贯理论解决跨文档共指问题