推荐文章
- [论文翻译]GPT-4 技术报告
- [论文翻译]大语言模型是少样本学习者
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [博客翻译]我对Kotlin的思考:4年后的展望
- [论文翻译]DeepSeek-V3 技术报告
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致
- [博客翻译]DeepFace:Python的轻量级深度人脸识别库
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理