OpenAI创始人兼CEO萨姆·阿尔特曼在谷歌发布Gemini 2.5 Pro实验版本后,迅速通过直播展示了最新的GPT-4o图像生成技术。此次升级使得图像生成更加精确,用户可以通过指令生成或编辑图像,并搭载了固有知识库以提供上下文支持。阿尔特曼在直播中自拍生成了一张AGI梗图,并分享了其对模型生成的感受。GPT-4o图像生成已陆续向Plus、Pro、Team和免费用户开放,企业和教育用户也将很快获得访问权限。与DALL·E不同,GPT-4o是原生嵌入ChatGPT的自回归模型,能够根据在线图像和文本的联合分发进行训练,生成一致且具备上下文感知的图像。然而,OpenAI也承认模型在生成图像时存在幻觉、裁剪不当和编辑不一致等问题,并已制定多种缓解策略以应对这些挑战。
评论
    公告

    AI千集是一个专注于科研服务的智能平台
    在这里您可以获得本平台自训练的
    科研智能体
    和小伙伴一起玩转AI,做自己的AI机器人
    来AI千集,赋能智慧快人一步
    扫一扫,快速获取解决方案与报价
    立即咨询

    千集助理
    连接科研与大众知识的桥梁
    让科学生活融入日常
    登陆小程序
    AI数字人随身守护
    智慧管理更高效
    生活品质悄然升级

    千集助理

    积分排行