
推荐文章
- [博客翻译]Phlex for Rails电子邮件:没有ERB的行动邮件
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型
- [论文翻译]时间工作记忆:基于查询引导的片段优化以增强多模态理解
- [论文翻译]Long-VITA:将大型多模态模型扩展到100万Token,同时保持领先的短上下文准确性
- [论文翻译]D-FINE:将DETR中的回归任务重新定义为细粒度分布优化
- [论文翻译]重新审视长尾分布下的对抗训练
- [论文翻译]智能推理:利用工具进行深度研究的大语言模型推理
- [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力
- [博客翻译]Show HN:Tangled-基于atproto构建的Git协作平台
- [智能分析]杭州福利待遇 TOP 25 的互联网公司,值得去!