推荐文章
- [博客翻译]用C编写一个简单的池分配器
- [论文翻译]Transformer 是 SSM:通过结构化状态空间对偶实现的通用模型和高效算法
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]语言模型是无监督多任务学习者
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [博客翻译]我对Kotlin的思考:4年后的展望
- [论文翻译]使用强化学习在开放式对话中进行动态规划
- [论文翻译]注意力就是你所需要的 (Attention Is All You Need)
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)