推荐文章
- [论文翻译]Tensor Product Attention Is All You Need
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [博客翻译]当最简单的并发程序违背所有直觉时
- [论文翻译]FaceXBench: 评估多模态大语言模型在人脸理解上的表现
- [博客翻译]Nvidia Tensor核心编程
- [论文翻译]Eliza: 一个 Web3 友好的 AI 智能体操作系统
- [论文翻译]THE AGENT COMPANY: 在大语言模型智能体上进行现实世界任务的基准测试
- [博客翻译]Transformer²:自适应性大语言模型
- [博客翻译]JTAG在2023年“黑客攻击”原始Xbox
- [论文翻译]大语言模型监督的预训练用于对话中的多模态情感识别