推荐文章
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]PaLM 2 技术报告
- [论文翻译]DeepSeek-V3 技术报告
- [论文翻译]BLOOM: 一个 176B 参数的开放访问多语言大语言模型
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致
- [博客翻译]iOS 18中的同态加密
- [论文翻译]从人类反馈中学习摘要生成
- [博客翻译]如何仅使用Nginx和纯bash跟踪网站分析
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调