
推荐文章
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型
- [论文翻译]AWQ:基于激活感知的权重量化技术,用于设备端大语言模型压缩与加速
- [博客翻译]HTTP/2在负载均衡器之后没有多大意义
- [智能分析]Light-A-Video 开源的无需训练视频重打光技术
- [论文翻译]Long-VITA:将大型多模态模型扩展到100万Token,同时保持领先的短上下文准确性
- [论文翻译]OpenRLHF: 一个易用、可扩展且高性能的 RLHF 框架
- [论文翻译]大语言模型的火热启动与规则执行采样
- [智能分析]清华开源智能爬虫系统Crawl4LLM:提升预训练效率5倍,支持无缝接入大语言模型
- [智能分析]掌握 UniApp 国际化实现方法,提升开发效率
- [智能分析]DeepSeek 开源周首秀:高效 MLA 解码内核 FlashMLA