
推荐文章
- [论文翻译]检索即注意力:在单一Transformer中端到端学习检索与阅读
- [论文翻译]XLNet: 用于语言理解的广义自回归预训练
- [博客翻译]结束OpenH264的篇章
- [论文翻译]Data Formulator 2: 数据可视化的迭代创建,AI 在过程中转换数据
- [论文翻译]BECLR: 批次增强对比少样本学习
- [论文翻译]Retrieval as Attention: 端到端学习单Transformer内的检索与阅读
- [论文翻译]MyGO 多重 CoT:通过双重思维链实现大语言模型自我反思的方法
- [论文翻译]关于Mixup训练:提升深度神经网络的校准性和预测不确定性
- [论文翻译]大规模短语密集表示学习
- [论文翻译]MA-BERT: 通过结合多属性知识在 Transformer 中学习表示