
推荐文章
- [论文翻译]Fine-mixing: 缓解微调语言模型中的后门问题
- [论文翻译]SAGA: 一种支持非强凸复合目标的快速增量梯度方法
- [论文翻译]MaTVLM: 用于高效视觉语言建模的混合 Mamba-Transformer
- [论文翻译]GPT4All: 开源压缩语言模型的生态系统
- [论文翻译]大规模短语密集表示学习
- [论文翻译]MA-BERT: 通过结合多属性知识在 Transformer 中学习表示
- [论文翻译]Comet: 面向专家混合模型的细粒度计算-通信重叠
- [论文翻译]检索增强生成在知识密集型 NLP 任务中的应用
- [论文翻译]Squeeze BERT:计算机视觉能为 NLP 提供哪些关于高效神经网络的启示?
- [论文翻译]PointGPT: 点云的自回归生成式预训练