推荐文章
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [论文翻译]大语言模型是少样本学习者
- [论文翻译]GPT-4 技术报告
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]语言模型是无监督多任务学习者
- [论文翻译]DeepSeek-V3 技术报告