监督微调 - 标签内容 | AI千集 — AI角色定制平台

[论文翻译]HuatuoGPT，探索将大语言模型训练成医生

本文介绍了医疗咨询大语言模型HuatuoGPT。该模型的核心方法是在监督微调阶段同时利用ChatGPT提炼数据和医生真实数据。ChatGPT的回复通常详尽、表述清晰且信息丰富，但在诸多方面无法像医生那样操作，例如综合诊断。我们认为医生真实数据能对提炼数据形成互补，使提炼后的语言模型具备医生般的表现。为充分发挥两类数据优势，我们采用RLAIF（基于AI反馈的强化学习）方式训练奖励模型，使语言模型兼具两类数据的优点。为评估模型性能，我们提出了一套综合评估方案（包含自动和人工指标）。实验结果表明，在GPT-4评估、人工评估和医疗基准数据集中，HuatuoGPT在开源大语言模型中实现了最先进的医疗咨询表现。值得注意的是，通过引入额外真实数据和RLAIF，提炼后的语言模型（即HuatuoGPT）在多数情况下超越了其教师模型ChatGPT。代码、数据及模型已开源：https://github.com/FreedomIntelligence/HuatuoGPT。在线演示见：https://www.HuatuoGPT.cn/。

由 Ylong发布于 2025-04-16 15:55:50 大语言模型监督微调强化学习阅读次数 1153
[论文翻译]DISC-MedLLM：连接通用大语言模型与现实世界医疗咨询

我们提出DISC-MedLLM，这是一种利用大语言模型(LLMs)在端到端对话医疗服务中提供准确真实医疗响应的综合解决方案。为构建高质量的监督微调(SFT)数据集，我们采用三种策略：运用医学知识图谱、重构真实世界对话、融合人工引导的偏好改写。这些数据集对训练DISC-MedLLM至关重要，使其在单轮和多轮诊疗场景中均超越现有医疗大语言模型。大量实验结果表明，该模型能有效弥合通用语言模型与实际医疗咨询之间的差距。我们同时开源了构建的数据集和模型权重以促进研究发展。更多细节与资源请访问https://github.com/FudanDISC/DISC-MedLLM。

由 Ylong发布于 2025-04-16 15:27:30 大语言模型监督微调阅读次数 1193
[论文翻译]ChatRadio-Valuer: 基于多机构多系统数据的通用放射学报告生成对话大语言模型

放射学报告生成作为医学影像分析的关键步骤，对临床决策层面的定量分析至关重要。然而，在大数据量下，复杂多样且存在跨源异质性的放射学报告对现有方法提出了巨大的泛化能力挑战，这主要源于不同机构、检查部位和放射科医师之间报告风格与规范性的显著差异。近期，大语言模型(LLM)的出现为识别健康状况体征提供了巨大潜力。为解决上述问题，我们与中国中南大学湘雅二医院合作，提出了基于LLM的ChatRadio-Valuer——一种通过学习可泛化表征、为复杂分析案例提供模型适配基础范式的定制化放射学报告自动生成模型。具体而言，ChatRadio-Valuer首先通过监督微调基于单一机构的放射学报告进行训练，随后适配至临床级事件中来自六家不同机构的人类多系统（胸部、腹部、肌肉骨骼、头面部及颈部）疾病诊断任务。本研究使用的临床数据集包含总计332,673例观测记录。从工程指标、临床效能和部署成本等综合评估结果来看，ChatRadio-Valuer在放射学报告的疾病诊断方面持续优于最先进模型，特别是ChatGPT(GPT-3.5-Turbo)和GPT-4等。该模型为提升模型泛化性能、减轻专家标注工作量提供了有效途径，从而推动放射学报告中临床AI应用的发展。

由 Ylong发布于 2025-04-15 22:38:13 监督微调chatgpt 阅读次数 1295
[论文翻译]HuatuoGPT-II，大语言模型医学适配的一站式训练方案

将语言模型 (LM) 适配到特定领域（即"领域适应"），是当通用语言模型（如 Llama2）未涵盖专业知识（例如医学）时的常见做法。这通常涉及持续预训练和监督微调的两阶段流程。采用这种两阶段管道方案不仅会引入复杂性（需要双重精细调优），还会导致两次数据分布偏移，加剧灾难性遗忘。为缓解这些问题，我们提出一种单阶段领域适应协议：将传统预训练和监督阶段的异构数据统一为简单的指令-输出对格式，从而实现高效知识注入。随后引入数据优先级采样策略，在训练期间自适应调整数据混合比例。基于该协议，我们训练了中文医疗领域专用大语言模型 HuatuoGPT-II。该模型在多项基准测试中与 GPT4 表现相当，尤其在多个中文医疗基准和最新执业药师资格考试中展现出最先进 (SOTA) 性能。此外，我们探索了单阶段协议现象，实验表明该协议的简洁性提升了训练稳定性和领域泛化能力。代码、数据及模型详见 https://github.com/FreedomIntelligence/HuatuoGPT-II 。

由 Ylong发布于 2025-04-15 21:48:30 通用语言模型预训练监督微调阅读次数 1061

[论文翻译]HuatuoGPT，探索将大语言模型训练成医生

[论文翻译]DISC-MedLLM：连接通用大语言模型与现实世界医疗咨询

[论文翻译]ChatRadio-Valuer: 基于多机构多系统数据的通用放射学报告生成对话大语言模型

[论文翻译]HuatuoGPT-II，大语言模型医学适配的一站式训练方案