推荐文章
- [博客翻译]跳过调试器中的无聊函数
- [博客翻译]任何足够先进的技术都与魔法无异
- [论文翻译]VAR视觉自回归建模:通过下一尺度预测生成可扩展的图像
- [论文翻译]Transformer 是 SSM:通过结构化状态空间对偶实现的通用模型和高效算法
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [博客翻译]INTELLECT–1:启动10B参数模型的分布式训练
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [博客翻译]我在Stripe工作的那些时光
- [论文翻译]注意力就是你所需要的 (Attention Is All You Need)
- [论文翻译]大语言模型是少样本学习者