• [论文翻译]French MedMC QA: 一个面向医学领域的法语多选题问答数据集

    本文介绍了French Me dMC QA,这是首个公开的法语医学领域多项选择题问答(MCQA)数据集。该数据集包含3,105道取自法国药学专业医学文凭真实考试的题目,混合了单选和多选题型。每个数据实例包含一个标识符、问题、五个备选答案及其人工校正答案。我们还提出了首个基线模型来自动处理这项MCQA任务,以报告当前性能表现并突显该任务的难度。详细的结果分析表明,必须采用适配医学领域或MCQA任务的表征方法:在我们的案例中,即使French Me dMC QA是法语数据集,英语专业模型的表现仍优于通用法语模型。语料库、模型和工具均已在线发布。
  • [论文翻译]FingerFlex: 从ECoG信号推断手指轨迹

    运动脑机接口(BCI)的开发高度依赖于神经时间序列解码算法。深度学习架构的最新进展使得自动特征选择能够近似数据中的高阶依赖关系。本文提出FingerFlex模型——一种适用于皮层脑电(ECoG)数据手指运动回归的卷积编码器-解码器架构。在公开可用的BCI竞赛IV数据集4上实现了最先进的性能,真实轨迹与预测轨迹之间的相关系数高达0.74。该方法为开发功能齐全的高精度皮层运动脑机接口提供了可能。
  • [论文翻译]COT COLLECTION:通过思维链微调提升大语言模型的零样本和少样本学习能力

    参数少于100B的语言模型(LM)在解决未见任务时,其思维链(CoT)推理能力明显逊色于大语言模型。本研究旨在通过CoT原理的指令微调,为小型LM赋予逐步推理能力。为此,我们首先引入了名为COT COLLECTION的新指令微调数据集,该数据集在原有Flan Collection(仅含9个CoT任务)基础上,新增了覆盖1,060个任务的184万条推理原理。实验表明,使用COT COLLECTION对Flan-T5(3B和11B)进行CoT微调后,小型LM在未见任务上展现出更强的CoT能力。
  • [论文翻译]RABIT: 一种利用双向特征金字塔网络与反向注意力实现结肠息肉分割的高效Transformer

    结肠息肉自动精确分割对结直肠癌早期诊断至关重要。先进深度学习模型在息肉分割领域已展现出良好效果,但在多尺度特征表示和泛化能力方面仍存在局限。为解决这些问题,本文提出RaBiT模型,其编码器采用基于Transformer的轻量级架构建模多层次全局语义关系,解码器则由多个带有反向注意力模块的双向特征金字塔层构成,能更有效融合多级特征图并逐步优化息肉边界。我们还提出改进方案以简化反向注意力模块,使其更适配多类别分割任务。在多个基准数据集上的实验表明,本方法在保持低计算复杂度的同时,性能优于现有所有方法。此外,跨数据集实验证明本方法具有优异泛化能力,即使训练集与测试集特征存在差异时仍表现稳健。
  • [论文翻译]基于YOLO的腕部骨折检测增强:先进单阶段检测模型分析

    诊断和治疗腕部异常(尤其是桡骨远端和尺骨骨折)是儿童、青少年和年轻成人群体中的关键问题,在青春期发病率较高。然而,放射科医师的稀缺以及医疗专业人员缺乏专业培训,对患者护理构成了重大风险。随着影像检查数量的增加和某些地区专科报告的获取受限,这一问题进一步加剧。这凸显了需要创新解决方案来改善腕部异常的诊断和治疗。
  • [论文翻译]DoubleU-Net: 用于医学图像分割的深度卷积神经网络

    摘要—语义图像分割是将图像每个像素标注对应类别的过程。基于编码器-解码器的U-Net及其变体是解决医学图像分割任务的常用策略。为提升U-Net在各类分割任务中的性能,我们提出名为DoubleU-Net的新型架构,该架构由两个级联的U-Net组成。首个U-Net采用预训练VGG-19作为编码器,该模型已从ImageNet学习特征并可轻松迁移至其他任务。为高效捕获更多语义信息,我们在底层追加了第二个U-Net,并采用空洞空间金字塔池化(ASPP)来捕获网络中的上下文信息。我们在涵盖结肠镜检、皮肤镜检和显微成像等多种模态的四个医学分割数据集上评估DoubleU-Net。在2015年MICCAI自动息肉检测子挑战数据集、CVC-ClinicDB、2018年Data Science Bowl挑战赛及病灶边界分割数据集上的实验表明,DoubleU-Net性能优于U-Net及基线模型。特别是在包含较小扁平息肉等挑战性图像的CVC-ClinicDB和2015年MICCAI自动息肉检测子挑战数据集上,DoubleU-Net能生成更精确的分割掩码。这些结果显示出对现有U-Net模型的改进。多个医学图像分割数据集上的优异表现表明,DoubleU-Net可作为医学图像分割和跨数据集评估测试的强基线,用于衡量深度学习(DL)模型的泛化能力。
  • [论文翻译]通过自我发现、自我分类和自我修复学习语义增强表示

    医学图像天然蕴含丰富的人体解剖语义信息,通过大量重复出现的解剖模式得以体现,这为促进深度语义表征学习及构建更强大的医学应用模型提供了独特潜力。然而,如何有效利用医学图像中这种强烈且自由的语义进行自监督学习仍亟待探索。为此,我们训练深度模型通过自发现、自分类和自恢复医学图像底层解剖结构来学习语义增强的视觉表征,最终构建出名为Semantic Genesis的通用预训练3D模型。我们在六项不同目标任务(涵盖CT、MRI和X射线等多种医学模态的分类与分割)上,对所有公开可用的自监督或全监督预训练模型进行了全面评测。大量实验表明,Semantic Genesis显著优于所有3D对比模型及基于ImageNet的2D迁移学习方法。这一优势源于我们新颖的自监督学习框架,该框架促使深度模型从医学图像中固有解剖结构所产生的大量解剖模式中学习具有说服力的语义表征。代码及预训练模型详见https://github.com/JLiangLab/Semantic_Genesis。
  • [论文翻译]基于深度神经网络的脑肿瘤分割

    本文提出了一种基于深度神经网络 (DNN) 的全自动脑肿瘤分割方法。所提出的网络专门针对磁共振成像 (MRI) 中呈现的胶质母细胞瘤 (包括低级别和高级别) 进行优化。由于这类肿瘤可能出现在大脑任何位置,且形态、尺寸和对比度差异极大,这促使我们探索一种兼具灵活性与高效性的高容量DNN机器学习解决方案。我们详细阐述了为获得竞争优势而必须采用的不同模型选择策略,重点研究了基于卷积神经网络 (CNN) 的各种架构设计 (即专门适配图像数据的DNN)。我们提出了一种区别于传统计算机视觉应用的新型CNN架构,该网络能同步利用局部特征和全局上下文特征。与大多数传统CNN应用不同,我们的网络采用全连接层的卷积实现作为最终层,实现了40倍的速度提升。此外,我们描述了一种两阶段训练方案以解决肿瘤标签不平衡问题,并探索了级联架构——将基础CNN的输出作为后续CNN的附加信息源。在2013年BRATS测试数据集上的实验表明,该架构在超越当前最优性能的同时,处理速度提升超过30倍。
  • [论文翻译]G-CASCADE: 用于二维医学图像分割的高效级联图卷积解码

    G-CASCADE通过高效的图卷积模块逐步细化由分层Transformer编码器生成的多阶段特征图。编码器利用自注意力机制捕获长程依赖关系,而解码器则借助图卷积模块的全局感受野保留长程信息来优化特征图。我们在五项医学图像分割任务 (即腹部器官、心脏器官、息肉病变、皮肤病变和视网膜血管) 中,使用多种Transformer编码器对解码器进行严格评估,结果表明该模型性能优于其他最先进 (SOTA) 方法。
  • [论文翻译]基于单模态与多模态对比损失的掩码视觉语言预训练在医学视觉问答中的应用

    摘要。医学视觉问答 (VQA) 是一项具有挑战性的任务,需要通过综合考虑视觉和语言信息来回答给定医学图像的临床问题。然而,由于医学 VQA 训练数据规模较小,预训练微调范式已成为提升模型泛化性能的常用解决方案。本文提出了一种新颖的自监督方法,利用医学图像描述数据集,通过单模态和多模态对比损失以及掩码语言建模和图文匹配作为预训练目标,学习输入图像和文本的单模态及多模态特征表示。
  • [论文翻译]一种用于皮肤病变勾画的边界感知分割扩散模型

    摘要:皮肤病变分割在皮肤病早期检测和准确诊断中起着关键作用。去噪扩散概率模型 (Denoising Diffusion Probabilistic Models, DDPMs) 近期因其卓越的图像生成能力受到广泛关注。基于这些进展,我们提出了Der moS eg Diff——一种在学习过程中融入边界信息的新型皮肤病变分割框架。该方法提出了一种在训练时优先处理边界区域的新型损失函数,并逐步降低其他区域的重要性。我们还设计了一种基于U-Net的新型去噪网络,能够高效整合网络内部的噪声与语义信息。在多个皮肤分割数据集上的实验结果表明,Der moS eg Diff优于现有基于CNN、Transformer和扩散模型的方法,展现了其在各种场景下的有效性和泛化能力。项目代码已在GitHub开源。
  • [论文翻译]FixCaps: 一种改进的胶囊网络用于皮肤癌诊断

    皮肤癌的早期检测能显著提高患者的五年生存率。即使是专业的皮肤科医生,也往往难以从皮肤图像中区分早期恶性肿瘤。因此,已有多种皮肤镜图像分类方法被提出,但这些方法在皮肤癌检测中存在不足或缺陷,且通常需要大量计算。本研究提出了一种改进的胶囊网络FixCaps,用于皮肤镜图像分类。
  • [论文翻译]Ch eXclusion: 深度胸部X光分类器中的公平性差距

    机器学习系统因其在临床任务中实现专家级表现的能力而备受关注,尤其在医学影像领域。本文研究了最先进的深度学习分类器在从X光图像生成诊断标签时,针对受保护属性是否存在偏见。我们训练卷积神经网络来预测3个著名公共胸部X光数据集(MIMIC-CXR、Chest-Xray8、CheXpert)以及这些数据集的多站点聚合中的14个诊断标签。我们评估了不同受保护属性(如患者性别、年龄、种族和作为社会经济地位替代指标的保险类型)之间的真阳性率(TPR)差异。研究表明,在所有数据集、所有临床任务和所有子组中,最先进的分类器均存在TPR差异。多源数据集对应的差异最小,这为减少偏见提供了一种途径。我们发现TPR差异与子组的疾病负担比例无显著相关性。随着临床模型从论文走向产品,我们建议临床决策者在部署前仔细审核算法差异。代码详见 https://github.com/La leh Seyyed/Ch eXclusion。
  • [论文翻译]用于图像分类的深度卷积神经网络多目标进化设计

    摘要—卷积神经网络(CNN)是众多视觉任务深度学习范式的核心架构。早期CNN架构的进步主要依靠人类专业知识和精心设计流程。近年来,神经架构搜索技术被提出以实现网络设计自动化并生成任务相关架构。虽然现有方法在图像分类任务中取得了优异性能,但由于以下两个原因,它们并不适用于计算资源受限的场景:(1) 所得架构要么仅针对分类性能优化,要么仅适配单一部署场景;(2) 大多数方法的搜索过程需要消耗大量计算资源。为克服这些限制,我们提出一种多目标进化算法来搜索神经架构,优化目标包括分类性能和浮点运算量(FLOPs)。该方法通过遗传操作逐步重组和修改架构组件,生成一组能逼近整个帕累托前沿的架构,从而解决第一个缺陷。
  • [论文翻译]评估StyleGAN2-ADA在医学图像上的表现

    摘要。尽管生成对抗网络 (GAN) 在医学影像领域展现出潜力,但其应用仍受四大限制因素制约:计算成本、数据需求、可靠评估指标及训练复杂性。本研究通过将StyleGAN2-ADA创新性应用于高分辨率医学影像数据集,逐一探究了这些挑战。我们的数据集包含非增强和增强计算机断层扫描 (CT) 中带有肝脏的轴向切片,并辅以四个不同成像模式的公开数据集。我们采用迁移学习 (基于Flickr-Faces-HQ数据集) 和数据增强 (水平翻转与自适应判别器增强) 训练StyleGAN2网络,通过Fréchet起始距离 (FID) 定量评估生成质量,并邀请七名放射科和结直肠科医师进行视觉图灵测试定性分析。
  • [论文翻译]G-CASCADE: 用于二维医学图像分割的高效级联图卷积解码

    通过高效的图卷积模块,逐步优化由分层 Transformer 编码器生成的多阶段特征图。编码器利用自注意力机制捕获长程依赖关系,而解码器则借助图卷积模块的全局感受野,在保留长程信息的同时细化特征图。我们在五项医学图像分割任务(腹部器官、心脏器官、息肉病变、皮肤病变和视网膜血管)中,使用多种 Transformer 编码器对解码器进行严格评估,结果表明我们的模型优于其他最先进 (SOTA) 方法。
  • [论文翻译]基于新型双路径交互融合模块模型的视网膜血管结构图像分割增强方法

    准确识别和区分视网膜中的微血管与大血管对于视网膜疾病的诊断至关重要,但这仍是一项重大挑战。当前基于自动编码的分割方法存在局限性,因为它们受限于编码器,且在编码阶段会降低分辨率。解码阶段无法恢复丢失的信息进一步阻碍了这些方法的效果,从而限制了它们提取视网膜微血管结构的能力。为解决这一问题,我们提出了Swin-Res-Net,这是一个专为提升视网膜血管分割精度而设计的模块。Swin-Res-Net采用Swin transformer(使用位移窗口进行分区)来降低网络复杂度并加速模型收敛。此外,该模型在Res2Net架构中集成了功能模块的交互融合。Res2Net利用多尺度技术扩大卷积核的感受野,从而能够从图像中提取更多语义信息。这种组合形成了一个新模块,可增强视网膜微血管的定位和分离能力。为提高血管信息处理的效率,我们还添加了一个模块来消除编码和解码步骤之间的冗余信息。
  • [论文翻译]填充K空间与优化图像:动态多对比MRI重建的提示方法

    摘要。动态或多对比度磁共振成像(MRI)重建的关键在于探索帧间或对比度间的信息。目前,展开模型(unrolled model)这种将迭代MRI重建步骤与可学习神经网络层相结合的方法,是MRI重建中性能最佳的方法。然而该方法存在两个主要局限:首先,展开模型结构和GPU内存限制制约了网络中每个去噪模块的容量,阻碍了有效提取重建所需的细节特征;其次,现有模型缺乏适应输入变化(如不同对比度、分辨率或视角)的灵活性,需要为每种输入类型单独训练模型,效率低下且可能导致重建不足。本文提出两阶段MRI重建流程来解决这些局限。第一阶段通过基于物理的重构方法来填补缺失的k空间数据:首先提出一个利用相邻帧/对比度和通道注意力捕捉固有帧间/对比度相关性的高效基线模型;随后将该基线模型扩展为基于提示学习(prompt-based learning)的PromptMR方法,实现多视角、多对比度、多相邻类型和多加速因子的统一MRI重建。第二阶段将第一阶段的输出作为通用视频修复问题,在图像域进一步融合相邻帧/对比度特征。大量实验表明,我们提出的方法显著优于现有最先进的加速MRI重建方法。
  • [论文翻译]端到端变分网络在加速MRI重建中的应用

    摘要。磁共振成像(MRI)的采集速度缓慢催生了两类互补方法:同步采集解剖结构的多个视图(并行成像),以及采集比传统信号处理方法所需更少的样本(压缩感知)。虽然这些方法的结合有望大幅缩短扫描时间,但从这种欠采样的多线圈数据中重建图像仍是一个悬而未决的难题。本文提出了一种新方法,通过端到端学习扩展了先前提出的变分方法。我们的方法在fastMRI数据集[18]上取得了脑部和膝部MRI的最新最优结果。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个私有数据集生成平台
在这里您可以获得本平台自训练的
LLM模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,获取AI数据集快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理是连通AI学研和企业的桥梁
登陆小程序
获取AI数字人贴身服务
工作生活效率瞬间提升

千集助理