• [论文翻译]基于提示的生物信息学:多组学分析的新界面

    基于提示的生物信息学重新定义了科学家与生物数据的交互方式,使得跨多组学层的自然语言查询成为可能。通过消除编码障碍并简化集成流程,这种范式促进了可访问的、假设驱动的科学发现。我们呼吁建立社区标准、教育体系融合与协同开发,以充分发挥其在科研与临床环境中的潜力。
  • [论文翻译]基于GPT-2模型的提示微调实现翻译后修饰预测

    翻译后修饰 (PTM) 在调节蛋白质功能和影响细胞过程 (如信号传导、定位和降解) 中起着关键作用。这些生物相互作用的复杂性需要高效的预测方法。在这项工作中,我们引入了 PTMGPT2,这是一种可解释的蛋白质语言模型,它利用基于提示的微调来提高其精确预测 PTM 的准确性。受 GPT 架构最新进展的启发,PTMGPT2 采用无监督学习来识别 PTM。它利用自定义提示来引导模型理解氨基酸序列中编码的微妙语言模式,生成指示 PTM 位点的 Token。为了提供可解释性,我们可视化模型最后解码层的注意力分布,以阐明对分子识别至关重要的序列模体,并分析 PTM 位点处或附近突变的影响,以提供对蛋白质功能的更深入理解。比较评估表明,PTMGPT2 在 19 种 PTM 类型中优于现有方法,突显了其在识别疾病关联和药物靶点方面的潜力...
  • [博客翻译]合成孔径雷达自动对焦与校准技术解析

    今年初,我成功研制了搭载于无人机的极化合成孔径雷达(SAR)。通过持续优化软件算法,现已实现图像质量的大幅提升。本文重点介绍三项关键技术突破:创新性混合自动对焦算法,专为无人机SAR系统优化;适用于非线性航迹的天线方向图归一化技术;极化校准新方法...
  • [论文翻译]代理式上下文工程:为自改进语言模型进化上下文

    大语言模型 (LLM) 应用(如智能体和领域特定推理)日益依赖上下文自适应——通过指令、策略或证据修改输入,而非权重更新。现有方法提升了可用性,但常受简洁性偏差影响(为追求简明摘要而丢失领域洞察),并遭遇上下文坍缩(迭代重写随时间推移侵蚀细节)。基于动态速查表提出的自适应记忆机制,我们引入ACE(Agentic Context Engineering)框架,将上下文视为不断演进的作战手册,通过生成、反思和整理的模块化过程积累、优化和组织策略。ACE通过结构化增量更新防止坍缩,保留详细知识并适配长上下文模型。在智能体和领域特定基准测试中,ACE同时优化离线(如系统提示)和在线(如智能体记忆)上下文,持续超越强基线:智能体任务提升 +10.6\%,金融任务提升 +8.6\% ,同时显著降低自适应延迟和部署成本。值得注意的是,ACE无需标注监督即可有效自适应,转而利用自然执行反馈。在AppWorld排行榜上,ACE在整体平均分追平排名第一的生产级智能体,并在更难的测试挑战集上实现超越,尽管使用的是更小的开源模型。这些结果表明,全面且持续演进的上下文能够以低开销实现可扩展、高效且自我改进的大语言模型系统。
  • [论文翻译]GME: 通过多模态LLMs改进通用多模态检索

    通用多模态检索 (UMR) 旨在通过统一模型实现跨多种模态的搜索,其中查询项和候选内容可以包含纯文本、图像或两者的组合。先前的研究尝试采用多模态大语言模型 (MLLM) 仅使用文本数据来实现 UMR。然而,我们的初步实验表明,更多样化的多模态训练数据能进一步释放 MLLM 的潜力。尽管现有方法有效,但当前多模态训练数据在模态层面存在严重不平衡,这促使我们开发训练数据合成流程并构建大规模高质量的融合模态训练数据集。基于合成训练数据,我们开发了通用多模态嵌入器 (GME),这是一种基于 MLLM 的稠密检索器,专为 UMR 设计。此外,我们构建了综合性的 UMR 基准测试 (UMRB) 以评估方法的有效性。实验结果表明,我们的方法在现有 UMR 方法中实现了最先进的性能。最后,我们深入分析了模型缩放和训练策略,并对模型和合成数据进行了消融研究。...
  • [博客翻译]2025年诺贝尔物理学奖:让量子效应走向宏观世界

    量子力学通常描述微观粒子尺度的现象。但三位获奖者在1984-1985年于加州大学伯克利分校设计了一个精巧实验:他们将两个超导体(零电阻材料)用纳米级绝缘层隔开,构成"约瑟夫森结"。实验中,超导体中数十亿电子对竟然像单一粒子般协同运动,展现出宏观量子隧穿效应——电流突然突破绝缘屏障产生电压,就像足球穿过墙壁般不可思议。
  • [论文翻译]基于生成式Transformer的人类疾病自然史学习

    近期人工智能 (AI) 的发展可能有助于解决多病建模中一些难以克服的方法学局限性。除了诊断数量庞大之外,这些挑战还包括对既往事件间时间依赖性的建模、整合预后相关的多样化数据以及预测的统计校准。大语言模型 (LLM) ——作为AI的一个分支领域,支撑了诸如ChatGPT等聊天机器人——将语言建模为词片段 (token) 的序列。新文本基于所有前文内容逐token生成。
  • [论文翻译]特征融合迁移能力感知Transformer在无监督域自适应中的应用

    无监督域适应 (UDA) 旨在利用从带标签的源域学到的知识提升无标签目标域的性能。虽然卷积神经网络 (CNN) 在以往的 UDA 方法中占据主导地位,但近期研究表明视觉 Transformer (ViT) 在该任务中具有潜力。本研究提出了一种新颖的特征融合迁移能力感知 Transformer (FFTAT) 来增强 ViT 在 UDA 任务中的表现。我们的方法包含两项关键创新:首先,引入一个 patch 判别器来评估 patch 的迁移能力,生成迁移能力矩阵。我们将该矩阵整合到自注意力机制中,引导模型关注可迁移的 patch。
  • [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型

    现在请按照上面的要求开始翻译以下内容为简体中文:最近,扩散模型 (diffusion models) 在图像合成领域取得了巨大成功。然而,当涉及包含多个对象的复杂场景的布局到图像生成 (layout-to-image generation) 时,如何同时精确控制全局布局图和每个细节对象仍是一项具有挑战性的任务。本文提出了一种名为 Layout Diffusion 的扩散模型,其生成质量和控制能力均优于先前工作。为解决图像与布局的多模态融合难题,我们提出构建具有区域信息的结构化图像块 (structural image patch),并将分块图像转换为特殊布局形式,从而实现与常规布局的统一融合。此外,本文提出的布局融合模块 (Layout Fusion Module, LFM) 和对象感知交叉注意力 (Object-aware Cross Attention, OaCA) 能够建模多对象间关系,其设计具备对象感知和位置敏感性,可精确控制空间相关信息。
  • [论文翻译]通过层次化关系和常识知识增强场景图生成

    本研究提出了一种通过结合关系层次结构和常识知识来生成场景图的增强方法。具体而言,我们首先提出了一种利用信息层次结构的分层关系头 (hierarchical relation head) ,联合预测图像中物体对之间的关系超类别以及每个超类别下的详细关系。随后,我们实现了一个鲁棒的常识验证流程 (commonsense validation pipeline) ,利用基础模型对场景图预测系统的结果进行批判性评估,即使使用小型纯语言模型也能消除无意义的谓词。
  • [论文翻译]用紧凑型Transformer (Compact Transformers) 逃离大数据范式

    随着Transformer成为语言处理的标准模型,并在计算机视觉领域取得进展,其参数量与训练数据规模也相应增长。这使许多人认为Transformer不适用于小规模数据场景,由此引发诸多担忧:某些科学领域的数据可获得性受限,以及资源有限的研究者被排除在该领域研究之外。本文通过引入紧凑型Transformer (Compact Transformers) 提出小规模学习方法。
  • [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域

    点交互式图像着色旨在当用户为特定位置提供颜色时对灰度图像进行着色。点交互式着色方法的关键在于将用户提供的颜色(即用户提示)适当传播至整张图像,从而以最少的用户操作获得合理的着色效果。然而,现有方法由于采用堆叠卷积层来传播提示至远处相关区域的低效设计,常产生局部着色结果。为解决该问题,我们提出iColoriT——一种利用Transformer全局感受野的新型点交互式着色视觉Transformer,能够将用户提示传播至相关区域。
  • [论文翻译]HiFaceGAN:基于协同抑制与补充的人脸修复技术

    有的人脸修复研究通常依赖于图像退化先验或显式指导标签进行训练,这往往导致对具有异质退化和丰富背景内容的真实图像泛化能力有限。本文通过解除对这两类先验的要求,研究了一个更具挑战性和实用性的"双盲"版本问题,称为"人脸翻新"(Face Renovation, FR)。具体而言,我们将FR表述为语义引导的生成问题,并采用协作抑制与补充(CSR)方法来解决。
  • [论文翻译]Relation3D:增强点云实例分割中的关系建模

    3D实例分割旨在预测场景中的一组物体实例,将其表示为带有对应语义标签的二进制前景掩码。当前,基于Transformer的方法因其优雅的流程和卓越的预测性能受到越来越多的关注。然而,这些方法主要通过掩码注意力建模场景特征与查询特征之间的外部关系,缺乏对场景特征内部关系以及查询特征之间关系的有效建模。针对这些不足,我们提出Relation3D:增强点云实例分割的关系建模。
  • [论文翻译]状态空间模型遇上Transformer:3D物体检测新范式

    基于DETR的方法通过多层Transformer解码器迭代优化物体查询(query),在3D室内物体检测中展现出优异性能。但Transformer解码器中的场景点特征始终保持固定,导致后续解码层贡献有限,制约了性能提升。近期状态空间模型(SSM)通过系统状态与输入的迭代交互,展现出线性复杂度的高效上下文建模能力。受此启发,我们提出新型交互式状态空间3D检测范式DEST。
  • [论文翻译]利用局部几何特征和图结构优化基于图神经网络的3D点云处理

    摘要—我们在用于3D点云处理的图神经网络(GNN)通用框架中,提出了简单而有效的点表示方法和局部邻域图构建改进方案。首先,我们提出通过加入点的关键局部几何信息来增强顶点表示,随后使用多层感知机(MLP)进行非线性投影。其次,我们改进了3D点云的GNN图构建方法。
  • [论文翻译]Mixing-Denoising 通用化占据网络

    虽然当前最先进的通用隐式神经形状模型[7,54]依赖于卷积的归纳偏置,但尚不完全清楚这些偏置所产生的属性如何与点云三维重建任务兼容。我们在此背景下探索了一种替代性的通用化方法:通过放松内在模型偏置(即使用MLP而非卷积来编码局部特征),转而采用与重建任务(即去噪)相关的辅助正则化来约束假设空间。
  • [论文翻译]UniTraj: 可扩展车辆轨迹预测的统一框架

    摘要:车辆轨迹预测日益依赖数据驱动的解决方案,但其跨数据领域的扩展能力以及更大规模数据集对泛化性能的影响仍缺乏深入研究。虽然这些问题可通过使用多个数据集来探究,但由于数据格式、地图分辨率和语义标注类型等差异,研究面临挑战。为此,我们提出UniTraj框架,该框架统一了多种数据集、模型和评估标准,为车辆轨迹预测领域带来新机遇。
公告

AI千集是AI智能体平台
在这里您可以获得本平台自训练的
AI智能体
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,赋能智慧快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理
连接科研与大众知识的桥梁
让科学生活融入日常
登陆小程序
AI数字人随身守护
智慧管理更高效
生活品质悄然升级

千集助理