AI千集
首页热点资讯知识笔记中英文章关于我们知识库客户端下载
登录
  • 最新
  • 推荐
  • AI医疗
  • AI写作
  • AI应用
  • AI基础
  • AI量化
  • AI数据
  • AI画图
  • AIGC
  • 编程基础
  • 课程演讲
  • 资料仓库
  • AI 自媒体保姆级教程:从注册到变现,小白照做就能上手

    icodebase 9天前 AIGC AI 自媒体个人创业
    0 / 134
  • Agent造富时代已来:不囤货、不熬夜,普通人的数字资产新机会

    icodebase 9天前 AIGC 第四次造富潮
    0 / 81
  • OpenClaw 最佳实践:弃用飞书,我把 AI 团队全搬到了 Discord

    icodebase 14天前 AIGC DiscordOpenClaw
    0 / 79
  • 2025年终总结&新年计划

    icodebase 16天前 AI基础 年终总结
    0 / 75
  • 为什么你一定要用OpenCode

    openoker 20天前 AI应用 opencode
    0 / 77
  • OpenClaw 远程访问配置指南

    icodebase 2026-02-05 12:49:17 AI应用 OpenClaw远程访问
    0 / 156
  • OpenClaw 安装配置教程

    icodebase 2026-02-05 11:28:47 AI基础 OpenClawAgent
    0 / 180
  • OpenClaw(旧称ClawdBot/Moltbot)下载安装使用,详细的图文教程

    icodebase 2026-01-31 22:23:53 AI基础 OpenClawClawdBotMoltbot
    0 / 243
  • 完整指南:如何使用Umaxing编辑图片

    icodebase 2026-01-29 10:00:56 AIGC umaxing
    0 / 123
  • 联系Umaxing团队

    icodebase 2026-01-29 09:48:13 AIGC umaxing
    0 / 151
  • OpenCode 与 OpenSkills 集成 API 文档

    icodebase 2026-01-28 20:58:28 AI基础 opencodeopenskills
    0 / 177
  • OpenSkills 零基础入门指南

    icodebase 2026-01-28 20:12:21 AIGC openskills
    0 / 134
  • 使用技能扩展 Claude

    icodebase 2026-01-28 18:46:56 AI基础 Skills
    0 / 164
  • OpenCode 安装和使用自定义模型实战

    icodebase 2026-01-23 17:11:08 AI基础 opencodeAI编程自动写代码
    0 / 227
  • OpenCode + Oh My OpenCode 配置和开发教程

    icodebase 2026-01-17 10:43:44 AI基础 opencode
    0 / 3675
  • OpenCode + Superpowers 安装教程

    icodebase 2026-01-16 15:39:20 AI基础 opencodeSuperpowers
    0 / 1941
  • AI编程奇点已经到来

    icodebase 2026-01-16 10:30:24 编程基础 AI编程
    0 / 251
  • 掌握 ulw、ralph-loop 与高效玩法

    icodebase 2026-01-15 19:55:16 编程基础 opencodeulwralph-loop
    0 / 470
  • Conda配置国内镜像源

    icodebase 2026-01-13 10:35:19 AI基础 conda
    0 / 157
  • Dify工作流:用爬虫批量把公众号文章存到AI知识库

    openoker 2025-11-04 11:35:47 AI应用 dify工作流爬虫
    0 / 816
  • Transformer模型详解

    icodebase 2025-10-27 19:42:25 AI基础 大模型AItransformer
    0 / 333
  • AI视频工厂使用说明

    icodebase 2025-10-20 12:33:45 AI应用 AI视频
    0 / 742
  • Docker将运行中容器打包成镜像并保存到本地

    icodebase 2025-10-13 17:36:25 AI基础 Docker
    0 / 419
  • Xinference部署教程

    icodebase 2025-10-11 14:20:25 AIGC Xinference大模型
    0 / 2044
  • RTX4090 跑 Qwen3 32B 模型实测

    icodebase 2025-07-13 10:39:56 AI基础 Qwen3
    0 / 562
  • ubuntu 22.04 安装 nvidia 驱动

    openoker 2025-07-03 19:41:50 AI基础 NVIDIA
    0 / 481
  • xfce4设置屏保/锁屏时间

    openoker 2025-07-03 14:18:13 AI基础 xfce
    0 / 667
  • vLLM 服务启动Qwen3-32B详细参数解析

    openoker 2025-06-20 09:55:04 AI基础 vLLM
    0 / 9990
  • AI TransPDF —AI PDF文档翻译

    132****1139 2025-05-23 11:58:15 AIGC
    1
    0 / 764
  • Qwen3:如何运行和微调

    openoker 2025-05-14 10:41:36 AI基础 Qwen3微调unsloth
    0 / 6512
  • 如何在本地高效运行和微调Qwen3模型

    openoker 2025-05-10 13:29:05 AI基础 Qwen3llama.cpp
    0 / 20087
  • llama.cpp使用教程

    openoker 2025-05-10 11:01:23 AI基础 llama.cpp
    0 / 821
  • 包管理工具UV使用指南

    icodebase 2025-04-21 14:01:21 AI基础 uvpython包安装器
    0 / 3389
  • 制作并量化GGUF模型上传到HuggingFace和ModelScope

    icodebase 2025-04-14 17:07:48 AI基础 GGUFGPUStackOllama
    0 / 1686
  • 解决传统医学大模型难以充分满足个性化需求的问题

    icodebase 2025-04-11 21:47:59 AI医疗 医学大模型个性化需求
    0 / 989
  • 大模型 + 长期慢病的预测和管理

    icodebase 2025-04-11 11:28:36 AI医疗 慢病预测疾病预测
    0 / 966
  • Agent-RAG + GraphRAG 双框架,让个性化治疗方案准确率高达 100%

    icodebase 2025-04-10 11:40:50 AI医疗 Agentic-RAGGraph-RAG
    0 / 1089
  • 免疫学基础知识

    openoker 2025-03-29 22:36:25 AI医疗 免疫学
    0 / 1007
  • 如何解读淋巴细胞亚群检测报告?

    openoker 2025-03-29 19:28:27 AI医疗 免疫检测
    0 / 840
  • 使用 LLaMA-Factory+AutoDL 微调 DeepSeek1.5B 笔记

    openoker 2025-03-16 21:55:15 AI基础 LLaMA-FactoryDeepSeek微调
    0 / 1495
  • Python 依赖管理工具 uv 使用笔记

    openoker 2025-03-10 16:40:51 AI基础 uvpythonpip
    0 / 4715
  • 使用国内镜像源加速安装PyTorch

    有贸 2025-03-08 21:02:55 AI基础 国内源pytorch镜像
    0 / 1691
  • 将 Open WebUI 从 SQLite 数据库迁移到 PostgreSQL 数据库

    有贸 2025-03-02 20:45:40 AI应用 open-webuiPostgreSQL知识库
    0 / 1164
  • Ollama 安装指南:解决国内下载慢和安装卡住问题

    icodebase 2025-02-16 14:52:51 AI基础 Ollama
    0 / 7052
  • AI代运营矩阵系统的发布选型

    openoker 2025-02-03 13:45:28 AI应用 矩阵系统内容运营
    0 / 1252
  • Ubuntu 安装 python3.8

    icodebase 2025-01-23 20:31:31 AI基础 python
    0 / 1084
  • Certificate verification failed: The certificate is NOT trusted

    icodebase 2025-01-23 19:48:22 AI基础 Linux
    0 / 967
  • 千集助理微信小程序评分在哪,如何评分

    openoker 2025-01-19 13:51:43 AI应用 千集助理
    0 / 1372
  • 《GPT 提示词大全》基础版(五)

    shadow 2025-01-09 17:22:03 AIGC
    0 / 1025
  • 《GPT 提示词大全》基础版(四)

    shadow 2025-01-09 17:20:47 AIGC
    0 / 993
上一页 下一页
  • 1
  • 2
  • 3
  • 4
  • 5
签到
立即签到
签到可以获得积分哦!
公告

AI千集是一个专注于科研服务的智能平台
在这里您可以获得本平台自训练的
科研智能体
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,赋能智慧快人一步
扫一扫,快速获取解决方案与报价
立即咨询

最新资讯更多
  • 我们提供了关于推理模型中表现性思维链(CoT)的证据,其中模型对其最终答案变得高度自信,但继续生成令牌而不透露其内部信念。我们的分析比较了激活探针、早期强制答题和CoT监视器在两个大型模型(DeepSeek-R1 671B & GPT-OSS 120B)中的表现,并发现任务难度特异性差异:模型的最终答案可从CoT中远早于监视器能够识别的位置从激活中解码,特别是对于简单的基于回忆的MMLU问题。我们将其与困难的多跳GPQA-Diamond问题中的真实推理进行对比。尽管如此,拐点(例如回溯、"恍然大悟"时刻)几乎完全出现在探针显示大信念转变的响应中,这表明这些行为追踪的是真实的不确定性而非学习到的"推理表演"。最后,探针引导的早期退出在MMLU上减少了高达80%的令牌,在GPQA-Diamond上减少了30%,同时保持相似的准确性,将注意力探针定位为检测表现性推理和启用自适应计算的有效工具。
    喜欢 0    评论 0
  • 当前的视频生成模型无法模拟3D动作的物理后果,如力和机器人操作,因为它们缺乏对动作如何影响3D场景的结构理解。我们提出RealWonder,首个用于从单张图像进行动作条件视频生成的实时系统。我们的关键洞察是使用物理模拟作为中间桥梁:与直接编码连续动作不同,我们通过物理模拟将动作转换为视频模型能处理的视觉表示(光流和RGB)。RealWonder集成三个组件:单图像3D重建、物理模拟和仅需4个扩散步骤的蒸馏视频生成器。我们的系统在480x832分辨率下实现13.2 FPS,能够在刚体、可变形体、流体和颗粒材料上进行力、机器人动作和相机控制的交互式探索。我们设想RealWonder为沉浸式体验、AR/VR和机器人学习中应用视频模型开辟了新的机会。我们的代码和模型权重在项目网站上公开提供:
    喜欢 0    评论 0
  • 随着人工智能模型从简单聊天机器人发展到更复杂的工作流程,我们逐渐接近一个事件地平线,超越这个地平线之后,人工智能系统将被应用于自主的、自我维持的反馈循环中。任何自主人工智能系统都将依赖于自动化、可验证的奖励和反馈;在基准事实稀缺或非确定性的环境中,一个实用的奖励来源是将大语言模型用作评判者(LLM-as-a-Judge)。尽管LLM评判者继续改进,但文献中尚未引入能够以强有力保证执行标准的系统,特别是在偏差向量未知或被对抗性发现的情况下。为了解决这一问题,我们提出了平均偏差界限性(Average Bias-Boundedness, A-BB),这是一个算法框架,可以正式保证减少由LLM评判者中任何可测量偏差造成的伤害/影响。在Arena-Hard-Auto上使用四个LLM评判者进行评估,我们在格式和概念偏差设置中实现了(τ=0.5, δ=0.01)偏差界限保证,同时保留了与原始排名61-99%的相关性,大多数评判者-偏差组合超过80%。再现我们研究结果的代码可在
    喜欢 0    评论 0
  • 建立共同基础,即一套共同的信念和相互认可的事实,对于协作至关重要,但对于当前的人工智能系统仍然是一个挑战,特别是在多模态、多方协作的场景中,协作者们掌握着不同的信息。我们引入了分布式部分信息谜题(DPIP),这是一个协作构建任务,在认知不对称的条件下引发了丰富的多模态交流。我们呈现了这些交互的多模态数据集,在语音、手势和动作模态上进行了标注和时间对齐,以支持对命题内容和信念动态的推理。随后,我们评估了两种常见基础建模范式:(1)最先进的大语言模型(LLMs),通过提示从多模态更新中推断共享信念,以及(2)一个基于动态认识逻辑(DEL)的公理化管道,可以增量地执行相同的任务。在标注的DPIP数据上的结果表明,该任务对现代LLMs追踪任务进展和信念状态的能力构成了挑战。
    喜欢 0    评论 0
  • 可信性是建立在大型语言模型(LLMs)基础上的智能体AI系统的核心研究挑战。为了增强信任度,多个来源的自然语言陈述,包括人工编写的文本、网络内容和模型输出,通常通过检索外部知识并使用LLM来验证陈述与检索证据的忠实度来进行事实性检查。因此,这些方法受到检索错误和外部数据可用性的限制,而模型的内在事实验证能力在很大程度上未被充分利用。我们提出了不依赖检索的事实核查任务,重点关注任意自然语言陈述的验证,独立于其来源。为了研究这一设定,我们引入了一个全面的评估框架,重点关注泛化能力,测试对以下方面的稳健性:(i)长尾知识、(ii)陈述来源的变化、(iii)多语言性和(iv)长文本生成。在9个数据集、18种方法和3个模型中,我们的实验表明,基于logit的方法通常相比利用内部模型表示的方法性能较差。基于这一发现,我们引入了INTRA,这是一种利用内部表示之间相互作用的方法,以强大的泛化能力实现了最先进的性能。更广泛地说,我们的工作将不依赖检索的事实核查确立为一个有前景的研究方向,它可以补充基于检索的框架、改进可扩展性,并使这些系统能够在训练过程中用作奖励信号或作为集成到生成过程中的组件。
    喜欢 0    评论 0
  • 从右删失生存数据中估计异质性处理效应(HTEs)在精准医学和个体化政策制定等高风险应用中至关重要。然而,生存分析设置由于删失、未观测的反事实和复杂的识别假设,为HTE估计带来了独特的挑战。尽管最近取得了进展,从因果生存森林到生存元学习器和结果插补方法,评估实践仍然存在碎片化和不一致的问题。我们介绍了SurvHTE-Bench,这是第一个用于删失结果HTE估计的综合基准。该基准包括:(i)一套模块化的合成数据集,具有已知的真实值,系统地改变因果假设和生存动态;(ii)将真实世界协变量与模拟处理和结果配对的半合成数据集;(iii)孪生研究(具有已知真实值)和HIV临床试验的真实世界数据集。在合成、半合成和真实世界设置中,我们首次在多样化条件和现实假设违反情况下进行了生存HTE方法的严格比较。SurvHTE-Bench为因果生存方法的公平、可重复和可扩展的评估奠定了基础。我们基准的数据和代码可在以下地址获取:
    喜欢 0    评论 0
积分排行
  • gingo

    104 帖子 • 8 评论

    1431
  • 137****0631

    0 帖子 • 0 评论

    997
  • weilaiweiding

    52 帖子 • 1 评论

    821
  • icodebase

    58 帖子 • 1 评论

    579
  • openoker

    171 帖子 • 23 评论

    298
  • boatingman

    0 帖子 • 1 评论

    90
  • toc

    0 帖子 • 0 评论

    60
  • Van

    3 帖子 • 0 评论

    42
  • shadow

    5 帖子 • 0 评论

    28
  • 11124

    2 帖子 • 4 评论

    24
友情链接 查看更多>>
  • 导航

    打造最强静态导航网站

  • 135AI排版

    公众号智能文案生成与自动排版工具

  • 二次元数字人视频生成平台

    二次元数字人视频生成平台

关于 标签 友链
粤ICP备18152112号 网信算备330110507206401230035号 粤公网安备44030302001590号 © 2018-2025 AI千集 All Rights Reserved