
推荐文章
- [论文翻译]检索即注意力:在单一Transformer中端到端学习检索与阅读
- [论文翻译]Search-R1: 通过强化学习训练大语言模型进行推理并利用搜索引擎
- [论文翻译]数学推理的自我奖励校正
- [论文翻译]Slim attention: 无需损失精度,将上下文内存减半 —— $K.$ -cache 是 MHA 所需的全部
- [论文翻译]Step-Video-TI2V 技术报告:一种先进的文本驱动图像到视频生成模型
- [论文翻译]强化学习优于监督微调:以音频问答为例
- [论文翻译]Fine-mixing: 缓解微调语言模型中的后门问题
- [论文翻译]Visual-RFT: 视觉强化微调
- [论文翻译]改进从 OPTICS 图中提取的聚类结构
- [论文翻译]通过非实验性深度学习实现 0.8% 奈奎斯特计算鬼成像