
推荐文章
- [博客翻译]HTTP/2在负载均衡器之后没有多大意义
- [论文翻译]OpenRLHF: 一个易用、可扩展且高性能的 RLHF 框架
- [博客翻译]东京和Prctl=讨厌的虫子
- [论文翻译]OmAgent:面向复杂视频理解的多模态智能体框架与任务分治策略
- [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力
- [智能分析]DeepSeek 开源周首秀:高效 MLA 解码内核 FlashMLA
- [论文翻译]Long-VITA:将大型多模态模型扩展到100万Token,同时保持领先的短上下文准确性
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型
- [博客翻译]不愿选择CBOR而不是MessagePack
- [论文翻译]大规模安全:大模型安全综合调查