
推荐文章
- [论文翻译]用于马尔可夫大语言模型测试时间扩展的思维原子
- [智能分析]“发言稿就在我的眼镜里!”同款今年随便买?
- [智能分析]AI工具成大学生报告论文“神器” 大学老师警告AI作文零分处理
- [论文翻译]Sigmoid Loss用于语言图像预训练
- [论文翻译]D-FINE:将DETR中的回归任务重新定义为细粒度分布优化
- [智能分析]AI合同大模型开启“脑力革命”时代
- [智能分析]DeepSeek 开源周首秀:高效 MLA 解码内核 FlashMLA
- [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力
- [博客翻译]Show HN:Tangled-基于atproto构建的Git协作平台
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型