推荐文章
- [论文翻译]通过部分线性前馈网络加速大语言模型
- [论文翻译]DeepSeek-V3 技术报告
- [论文翻译]生成式 AI 驱动的元数据建模方法
- [论文翻译]使用多视角图像和负指令缓解对象属性幻觉
- [博客翻译]在单精度通用矩阵乘法中击败cuBLAS
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]一个人无法独自创作梗图:评估大语言模型与人类在幽默生成中的协同创造力
- [论文翻译]TB-Bench:用于从行车记录仪图像/视频中理解时空交通行为的训练和测试多模态 AI
- [论文翻译]大语言模型监督的预训练用于对话中的多模态情感识别
- [论文翻译]通过部分线性前馈网络加速大语言模型