
推荐文章
- [论文翻译]检索增强生成在知识密集型 NLP 任务中的应用
- [论文翻译]MaTVLM: 用于高效视觉语言建模的混合 Mamba-Transformer
- [论文翻译]Squeeze BERT:计算机视觉能为 NLP 提供哪些关于高效神经网络的启示?
- [论文翻译]大规模短语密集表示学习
- [论文翻译]基于一组新的二元统计图像特征的虹膜纹理图像性别分类
- [论文翻译]ERNIE-GEN:一种增强的多流预训练与微调框架用于自然语言生成
- [论文翻译]Slim attention: 无需损失精度,将上下文内存减半 —— $K.$ -cache 是 MHA 所需的全部
- [论文翻译]小规模大语言模型中的强化学习推理:有效与无效之处
- [论文翻译]MA-BERT: 通过结合多属性知识在 Transformer 中学习表示
- [论文翻译]PointGPT: 点云的自回归生成式预训练