
推荐文章
- [论文翻译]重新审视长尾分布下的对抗训练
- [论文翻译]MaTVLM: 用于高效视觉语言建模的混合 Mamba-Transformer
- [论文翻译]Pandora3D: 高质量3D形状与纹理生成的综合框架
- [论文翻译]Fine-mixing: 缓解微调语言模型中的后门问题
- [论文翻译]YOLOE: 实时视觉感知
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型
- [智能分析]杭州福利待遇 TOP 25 的互联网公司,值得去!
- [论文翻译]Visual-RFT: 视觉强化微调
- [论文翻译]Search-R1: 通过强化学习训练大语言模型进行推理并利用搜索引擎
- [论文翻译]强化学习优于监督微调:以音频问答为例