推荐文章
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [博客翻译]如何仅使用Nginx和纯bash跟踪网站分析
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [论文翻译]大语言模型是少样本学习者
- [论文翻译]评估训练于代码的大语言模型
- [博客翻译]在不断变化的地形中寻找移动目标的路径
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [博客翻译]关于机器人学与人工智能复杂性的常见误解
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?