OpenAI近日发布了MRCR基准测试,旨在评估AI模型在超长上下文中的信息处理能力。与传统的“大海捞针”测试不同,MRCR要求模型在大量文本中区分并找到多个相同的“针”中的特定一个,难度极大。GPT-4.1在此测试中表现出色,能够在100万个tokens的上下文中准确检索信息。MRCR不仅揭示了当前AI的能力边界,还推动了更强大、更可靠模型的研发。这一测试为AI模型设置了新的挑战,帮助研究者更好地理解模型的强项和弱点,促进技术的进步和审慎应用。
评论
    公告

    AI千集是一个私有数据集生成平台
    在这里您可以获得本平台自训练的
    LLM模型服务
    和小伙伴一起玩转AI,做自己的AI机器人
    来AI千集,获取AI数据集快人一步
    扫一扫,快速获取解决方案与报价
    立即咨询

    千集助理是连通AI学研和企业的桥梁
    登陆小程序
    获取AI数字人贴身服务
    工作生活效率瞬间提升

    千集助理

    积分排行