
推荐文章
- [论文翻译]分析近红外眼图像中协变量对性别和种族预测的影响
- [论文翻译]Search-R1: 通过强化学习训练大语言模型进行推理并利用搜索引擎
- [论文翻译]Slim Attention:无需损失精度即可将上下文内存减半 —— $K.$ -cache 是 MHA 所需的全部
- [论文翻译]ERNIE-GEN:一种增强的多流预训练与微调框架用于自然语言生成
- [论文翻译]Visual-RFT: 视觉强化微调
- [论文翻译]Fine-mixing: 缓解微调语言模型中的后门问题
- [论文翻译]Comet: 面向专家混合模型的细粒度计算-通信重叠
- [论文翻译]强化学习优于监督微调:以音频问答为例
- [论文翻译]基于装箱配置树的高效在线三维装箱学习
- [论文翻译]检索即注意力:在单一Transformer中端到端学习检索与阅读