医疗诊断 - 标签内容 | AI千集 — AI角色定制平台

[论文翻译]LLM-Mini-CEX: 大语言模型在诊断对话中的自动评估

目的：开发用于医疗诊断的大语言模型(LLM)以提高诊断效率的兴趣日益增长。尽管其技术潜力诱人，但目前缺乏统一全面的评估标准，导致无法评估医疗大语言模型的质量和潜在风险，进一步阻碍了大语言模型在医疗场景中的应用。此外，当前评估严重依赖与大语言模型的劳动密集型交互来获取诊断对话，并需人工评估诊断对话的质量。

由 Ylong发布于 2025-04-18 22:10:28 医疗诊断大语言模型阅读次数 1222