推荐文章
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]利用大语言模型高效表示企业Web应用程序结构以服务于智能质量工程
- [论文翻译]LLAMA 2: 开源基础模型和微调聊天模型
- [博客翻译]如何仅使用Nginx和纯bash跟踪网站分析
- [论文翻译]通过生成式预训练提升语言理解能力
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理