• [论文翻译]CPLLM: 基于大语言模型的临床预测

    我们提出了临床预测大语言模型 (CPLLM),该方法通过对预训练的大语言模型 (LLM) 进行微调,用于临床疾病和再入院预测。我们采用量化技术并通过提示词对LLM进行微调。在诊断预测任务中,我们基于患者历史诊断记录,预测其下次就诊或后续诊断中是否会被确诊为目标疾病。我们将实验结果与RETAIN、Med-BERT(当前使用时序结构化电子健康记录数据进行疾病预测的最先进模型)等多种基线模型进行了对比。此外,我们还评估了CPLLM在患者再入院预测任务中的表现,并与基准基线模型进行了性能比较。实验结果表明,我们提出的CPLLM方法在PR-AUC和ROC-AUC指标上均优于所有测试模型,在诊断预测和患者再入院预测任务中均取得了最先进的成果。该方法可轻松部署并整合到临床流程中,辅助医护人员预判患者的病情发展。
  • [论文翻译]RadLLM: 面向放射学的大语言模型综合医疗基准

    大语言模型(LLM)的崛起标志着自然语言处理(NLP)领域的关键转折。这些模型已彻底改变多个领域,并在医疗行业产生重大影响。当前大语言模型数量空前,其中许多具备中英双语能力。然而针对这些模型的全面评估仍有待开展,这一缺失在放射学NLP领域尤为明显。本研究通过严格评估32个大语言模型解读放射学报告(放射学NLP的核心环节)的能力来填补这一空白,重点测试模型从影像学表现推导诊断意见的能力。评估结果揭示了这些大语言模型的性能表现、优势与不足,为其在医疗领域的实际应用提供了重要参考。
  • [论文翻译]探索GPT-4在放射学领域的边界

    通用领域大语言模型(LLM)的最新成功显著改变了自然语言处理范式,朝着跨领域和跨应用的统一基础模型方向发展。本文重点评估当前最强大的大语言模型GPT-4在基于文本的放射学报告应用中的表现,并与最先进的(SOTA)放射学专用模型进行比较。通过探索多种提示策略,我们在多种常见放射学任务上评估GPT-4,发现GPT-4要么优于当前SOTA放射学模型,要么与之持平。在零样本提示下,GPT-4在时间句子相似性分类(准确率)和自然语言推理\$(F_{1})\$方面已经比放射学模型获得显著提升(绝对改进约10%)。对于需要学习数据集特定风格或模式的任务(如检查结果总结),GPT-4通过基于示例的提示得到改进,并达到有监督SOTA的水平。我们与委员会认证的放射科医生进行的广泛错误分析表明,GPT-4具有足够的放射学知识水平,仅在需要细微领域知识的复杂上下文中偶尔出错。对于检查结果总结,GPT-4的输出总体上与现有人工撰写的印象相当。
  • [博客翻译]精调与隐私:Corgea的LLM如何提升企业应用安全

    我们正在研发一款人工智能应用安全工程师,帮助开发者自动识别并修复不安全的代码。通过我们的技术,能减少30%的安全性静态分析(SAST)发现的误报,并加速修复过程约80%。为了服务大型企业,我们精心调整了一个模型,确保其既安全又私密。为什么我们自定义调优LLM?在严格监管的行业,企业对数据驻留、隐私和安全有严格要求。它们往往需要私有云部署,避免依赖可能暴露数据风险的第三方LLM。我们的定制...
  • [博客翻译]挑战人工智能的神话

    在数字世界中,数据中心的庞然大物和光纤电缆构成了我们想象的基础,而这些想象又深受提供基于此基础设施服务的公司影响。由此诞生了一种技术神话,它倾向于提供简单易懂的解释,却牺牲了准确性。科技产品的营销者拥有巨大的影响力,他们可能通过复杂性来隐藏产品难题,或者通过过度简化来磨平棱角。设计师在塑造这种神话的过程中扮演关键角色,尽管并非总是出于恶意,营销行业本身就需要这样的神话来帮助理解技术。 人工智能的神话多种多样,它们并非全然负面,但持续塑造着我们对AI的认知。比如控制神话,强调生成式AI的可控性,但实际上,用户...
  • [博客翻译]克服当前大语言模型的局限

    大语言模型(LLM)已经风光了一段时间,但超越喧嚣,它们面临着严重的限制:幻觉、缺乏置信度估计以及缺乏引用。幻觉是指LLM生成看似合理甚至有说服力的内容,但实际上毫无根据或错误。置信度估计为预测分配一个置信分数,有助于判断其准确性。错误答案的高置信分数比完全没有分数更糟糕……
  • [博客翻译]命令行上的语言模型探索之旅

    上周,我在为期六周的“掌握大型语言模型:开发者与数据科学家会议”上做了一场演讲,主题是如何从命令行访问和利用大型语言模型。我的重点是介绍我开发的名为LLM的Python命令行工具,以及如何使用它及其插件来探索这些模型,并将其用于实际任务。 演讲视频被录制并上传到了YouTube,我还将其转换成了带有详细注释和屏幕截图的演示文稿(没有幻灯片)。LLM是一个工具,旨在帮助用户直接在终端中运行大型语言模型提示。你可以通过pipx、pip或brew安装它...
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个二次元智能客服平台
在这里您可以获得本平台自训练的
客服大模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,订单转化快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理是连通AI学研和企业的桥梁
登陆小程序
获取AI数字人贴身服务
工作生活效率瞬间提升

千集助理