推荐文章
- [论文翻译]加速围棋的自我对弈学习
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]BERT: 深度双向 Transformer 用于语言理解的预训练
- [知识百科]燃爆职场:激活员工积极性的策略,从环境到领导艺术与实战案例
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [论文翻译]OPT: 开放预训练 Transformer 语言模型
- [博客翻译]我对Kotlin的思考:4年后的展望
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]Transformer 是 SSM:通过结构化状态空间对偶实现的通用模型和高效算法