
推荐文章
- [论文翻译]GPTScore: 按需评估
- [论文翻译]LLM-Mini-CEX: 大语言模型在诊断对话中的自动评估
- [论文翻译]LinVT: 赋能图像级大语言模型理解视频
- [论文翻译]神经网络中的元学习 (Meta-Learning) 综述
- [论文翻译]MedGPTEval: 用于评估大语言模型在医学领域响应能力的数据集与基准
- [论文翻译]人类生成数据会耗尽吗?基于人类数据的大语言模型扩展极限
- [论文翻译]Flash-VStream: 基于内存的长视频流实时理解系统
- [论文翻译]基于ChatGPT的放射学报告摘要迭代优化框架
- [论文翻译]可编辑神经网络
- [论文翻译]Safety Bench: 评估大语言模型的安全性