
推荐文章
- [论文翻译]Data Formulator 2: 数据可视化的迭代创建,AI 在过程中转换数据
- [论文翻译]Spark-TTS: 基于大语言模型的高效文本转语音模型,采用单流解耦语音Token
- [论文翻译]分析近红外眼图像中协变量对性别和种族预测的影响
- [论文翻译]检索即注意力:在单一Transformer中端到端学习检索与阅读
- [论文翻译]GPT4All: 开源压缩语言模型的生态系统
- [论文翻译]Slim Attention:无需损失精度即可将上下文内存减半 —— $K.$ -cache 是 MHA 所需的全部
- [论文翻译]Slim attention: 无需损失精度,将上下文内存减半 —— $K.$ -cache 是 MHA 所需的全部
- [论文翻译]: 基于大语言模型的算法设计平台
- [论文翻译]SAGA: 一种支持非强凸复合目标的快速增量梯度方法
- [论文翻译]ERNIE-GEN:一种增强的多流预训练与微调框架用于自然语言生成