
推荐文章
- [博客翻译]Show HN:Tangled-基于atproto构建的Git协作平台
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型
- [论文翻译]IndexTTS: 一款工业级可控且高效的零样本文本转语音系统
- [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力
- [论文翻译]HybridFlow: 灵活高效的 RLHF 框架
- [博客翻译]在Go中从头开始构建BitTorrent客户端
- [论文翻译]LIMR: 少即是多——强化学习的扩展策略
- [论文翻译]OpenRLHF: 一个易用、可扩展且高性能的 RLHF 框架
- [博客翻译]纯函数滑动窗口聚合算法
- [智能分析]清华开源智能爬虫系统Crawl4LLM:提升预训练效率5倍,支持无缝接入大语言模型