AI千集
首页热点资讯知识笔记中英文章关于我们知识库客户端下载
登录
  • 最新
  • 推荐
  • AI医疗
  • AI写作
  • AI应用
  • AI基础
  • AI量化
  • AI数据
  • AI画图
  • AIGC
  • 编程基础
  • 课程演讲
  • 资料仓库
  • 100天深度学习--PartA:Week1-day2 AlexNet

    gingo 2021-03-10 16:31:41 AI基础 AlexNet经典网络
    0 / 1690
  • 100天深度学习--PartA:Week1-day1 Lenet

    gingo 2021-03-10 16:26:59 AI基础 经典网络
    3
    0 / 1775
  • AlphaTree:一张RoadMap,四个层次,十个方向百份源码,带你详细了解Gan发展历程

    gingo 2021-03-10 16:11:39 课程演讲 GAN综述alphatree
    2
    0 / 2196
  • 一图看完AI应用之深度学习十大经典算法(含论文代码)

    gingo 2021-03-10 16:09:07 AI基础 综述alphatree经典网络
    1
    0 / 1850
  • 深度学习中GAN在动漫领域的应用(公开课节选)

    gingo 2021-03-10 16:07:57 课程演讲 GAN二次元动漫
    0 / 2052
  • 推荐系统架构设计

    openoker 2021-03-08 20:20:51 编程基础 推荐系统架构
    0 / 1336
  • 中文自然语言处理现状

    6 2021-03-05 11:05:30 资料仓库 NLP知识图谱
    0 / 1952
  • 一个22万张NSFW图片的鉴黄数据集

    openoker 2021-02-23 10:05:23 AI数据 深度学习数据集
    1
    1 / 1720
  • Pytorch 训练与预测时爆显存(out of memory)的解决方案

    6 2020-12-30 14:06:32 资料仓库 pytorch深度学习out of memory
    2
    0 / 2952
  • Markdown: Basics (快速入门)

    openoker 2020-12-17 15:11:21 资料仓库 Markdown
    0 / 1334
  • Markdown 语法说明 (简体中文版)

    openoker 2020-12-17 14:58:14 资料仓库 Markdown
    1
    0 / 1269
上一页 下一页
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
签到
立即签到
签到可以获得积分哦!
公告

AI千集是一个专注于科研服务的智能平台
在这里您可以获得本平台自训练的
科研智能体
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,赋能智慧快人一步
扫一扫,快速获取解决方案与报价
立即咨询

最新资讯更多
  • 我们提供了关于推理模型中表现性思维链(CoT)的证据,其中模型对其最终答案变得高度自信,但继续生成令牌而不透露其内部信念。我们的分析比较了激活探针、早期强制答题和CoT监视器在两个大型模型(DeepSeek-R1 671B & GPT-OSS 120B)中的表现,并发现任务难度特异性差异:模型的最终答案可从CoT中远早于监视器能够识别的位置从激活中解码,特别是对于简单的基于回忆的MMLU问题。我们将其与困难的多跳GPQA-Diamond问题中的真实推理进行对比。尽管如此,拐点(例如回溯、"恍然大悟"时刻)几乎完全出现在探针显示大信念转变的响应中,这表明这些行为追踪的是真实的不确定性而非学习到的"推理表演"。最后,探针引导的早期退出在MMLU上减少了高达80%的令牌,在GPQA-Diamond上减少了30%,同时保持相似的准确性,将注意力探针定位为检测表现性推理和启用自适应计算的有效工具。
    喜欢 0    评论 0
  • 当前的视频生成模型无法模拟3D动作的物理后果,如力和机器人操作,因为它们缺乏对动作如何影响3D场景的结构理解。我们提出RealWonder,首个用于从单张图像进行动作条件视频生成的实时系统。我们的关键洞察是使用物理模拟作为中间桥梁:与直接编码连续动作不同,我们通过物理模拟将动作转换为视频模型能处理的视觉表示(光流和RGB)。RealWonder集成三个组件:单图像3D重建、物理模拟和仅需4个扩散步骤的蒸馏视频生成器。我们的系统在480x832分辨率下实现13.2 FPS,能够在刚体、可变形体、流体和颗粒材料上进行力、机器人动作和相机控制的交互式探索。我们设想RealWonder为沉浸式体验、AR/VR和机器人学习中应用视频模型开辟了新的机会。我们的代码和模型权重在项目网站上公开提供:
    喜欢 0    评论 0
  • 随着人工智能模型从简单聊天机器人发展到更复杂的工作流程,我们逐渐接近一个事件地平线,超越这个地平线之后,人工智能系统将被应用于自主的、自我维持的反馈循环中。任何自主人工智能系统都将依赖于自动化、可验证的奖励和反馈;在基准事实稀缺或非确定性的环境中,一个实用的奖励来源是将大语言模型用作评判者(LLM-as-a-Judge)。尽管LLM评判者继续改进,但文献中尚未引入能够以强有力保证执行标准的系统,特别是在偏差向量未知或被对抗性发现的情况下。为了解决这一问题,我们提出了平均偏差界限性(Average Bias-Boundedness, A-BB),这是一个算法框架,可以正式保证减少由LLM评判者中任何可测量偏差造成的伤害/影响。在Arena-Hard-Auto上使用四个LLM评判者进行评估,我们在格式和概念偏差设置中实现了(τ=0.5, δ=0.01)偏差界限保证,同时保留了与原始排名61-99%的相关性,大多数评判者-偏差组合超过80%。再现我们研究结果的代码可在
    喜欢 0    评论 0
  • 建立共同基础,即一套共同的信念和相互认可的事实,对于协作至关重要,但对于当前的人工智能系统仍然是一个挑战,特别是在多模态、多方协作的场景中,协作者们掌握着不同的信息。我们引入了分布式部分信息谜题(DPIP),这是一个协作构建任务,在认知不对称的条件下引发了丰富的多模态交流。我们呈现了这些交互的多模态数据集,在语音、手势和动作模态上进行了标注和时间对齐,以支持对命题内容和信念动态的推理。随后,我们评估了两种常见基础建模范式:(1)最先进的大语言模型(LLMs),通过提示从多模态更新中推断共享信念,以及(2)一个基于动态认识逻辑(DEL)的公理化管道,可以增量地执行相同的任务。在标注的DPIP数据上的结果表明,该任务对现代LLMs追踪任务进展和信念状态的能力构成了挑战。
    喜欢 0    评论 0
  • 可信性是建立在大型语言模型(LLMs)基础上的智能体AI系统的核心研究挑战。为了增强信任度,多个来源的自然语言陈述,包括人工编写的文本、网络内容和模型输出,通常通过检索外部知识并使用LLM来验证陈述与检索证据的忠实度来进行事实性检查。因此,这些方法受到检索错误和外部数据可用性的限制,而模型的内在事实验证能力在很大程度上未被充分利用。我们提出了不依赖检索的事实核查任务,重点关注任意自然语言陈述的验证,独立于其来源。为了研究这一设定,我们引入了一个全面的评估框架,重点关注泛化能力,测试对以下方面的稳健性:(i)长尾知识、(ii)陈述来源的变化、(iii)多语言性和(iv)长文本生成。在9个数据集、18种方法和3个模型中,我们的实验表明,基于logit的方法通常相比利用内部模型表示的方法性能较差。基于这一发现,我们引入了INTRA,这是一种利用内部表示之间相互作用的方法,以强大的泛化能力实现了最先进的性能。更广泛地说,我们的工作将不依赖检索的事实核查确立为一个有前景的研究方向,它可以补充基于检索的框架、改进可扩展性,并使这些系统能够在训练过程中用作奖励信号或作为集成到生成过程中的组件。
    喜欢 0    评论 0
  • 从右删失生存数据中估计异质性处理效应(HTEs)在精准医学和个体化政策制定等高风险应用中至关重要。然而,生存分析设置由于删失、未观测的反事实和复杂的识别假设,为HTE估计带来了独特的挑战。尽管最近取得了进展,从因果生存森林到生存元学习器和结果插补方法,评估实践仍然存在碎片化和不一致的问题。我们介绍了SurvHTE-Bench,这是第一个用于删失结果HTE估计的综合基准。该基准包括:(i)一套模块化的合成数据集,具有已知的真实值,系统地改变因果假设和生存动态;(ii)将真实世界协变量与模拟处理和结果配对的半合成数据集;(iii)孪生研究(具有已知真实值)和HIV临床试验的真实世界数据集。在合成、半合成和真实世界设置中,我们首次在多样化条件和现实假设违反情况下进行了生存HTE方法的严格比较。SurvHTE-Bench为因果生存方法的公平、可重复和可扩展的评估奠定了基础。我们基准的数据和代码可在以下地址获取:
    喜欢 0    评论 0
积分排行
  • gingo

    104 帖子 • 8 评论

    1431
  • 137****0631

    0 帖子 • 0 评论

    997
  • weilaiweiding

    52 帖子 • 1 评论

    821
  • icodebase

    58 帖子 • 1 评论

    579
  • openoker

    171 帖子 • 23 评论

    298
  • boatingman

    0 帖子 • 1 评论

    90
  • toc

    0 帖子 • 0 评论

    60
  • Van

    3 帖子 • 0 评论

    42
  • shadow

    5 帖子 • 0 评论

    28
  • 11124

    2 帖子 • 4 评论

    24
友情链接 查看更多>>
  • 导航

    打造最强静态导航网站

  • 135AI排版

    公众号智能文案生成与自动排版工具

  • 二次元数字人视频生成平台

    二次元数字人视频生成平台

关于 标签 友链
粤ICP备18152112号 网信算备330110507206401230035号 粤公网安备44030302001590号 © 2018-2025 AI千集 All Rights Reserved