推荐文章
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致
- [博客翻译]B-Trees:比我想知道的还要多
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]Eliza: 一个 Web3 友好的 AI 智能体操作系统
- [论文翻译]从人类反馈中学习总结
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [博客翻译]2024年的IP地址分配情况
- [论文翻译]OPT: 开放预训练 Transformer 语言模型