
推荐文章
- [论文翻译]基于先进Transformer的语言模型演化分析:观点挖掘实验
- [论文翻译]Squeeze BERT:计算机视觉能为 NLP 提供哪些关于高效神经网络的启示?
- [论文翻译]MyGO 多重 CoT:通过双重思维链实现大语言模型自我反思的方法
- [论文翻译]XLNet: 用于语言理解的广义自回归预训练
- [论文翻译]RegNet: 用于图像分类的自调节网络
- [论文翻译]Search-R1: 通过强化学习训练大语言模型进行推理并利用搜索引擎
- [论文翻译]检索增强生成在知识密集型 NLP 任务中的应用
- [论文翻译]基于迁移的少样本学习中特征分布的利用
- [论文翻译]小规模大语言模型中的强化学习推理:有效与无效之处
- [论文翻译]PyTorch 中的自动微分