[论文翻译]LLM-Mini-CEX: 大语言模型在诊断对话中的自动评估 目的:开发用于医疗诊断的大语言模型(LLM)以提高诊断效率的兴趣日益增长。尽管其技术潜力诱人,但目前缺乏统一全面的评估标准,导致无法评估医疗大语言模型的质量和潜在风险,进一步阻碍了大语言模型在医疗场景中的应用。此外,当前评估严重依赖与大语言模型的劳动密集型交互来获取诊断对话,并需人工评估诊断对话的质量。 由 Ylong发布于 2025-04-18 22:10:28 医疗诊断大语言模型 阅读次数 404