资讯 | AI千集

这家伙很懒，什么都没留下

2025-03-26 20:02:49

OpenAI创始人兼CEO萨姆·阿尔特曼在谷歌发布Gemini 2.5 Pro实验版本后，迅速通过直播展示了最新的GPT-4o图像生成技术。此次升级使得图像生成更加精确，用户可以通过指令生成或编辑图像，并搭载了固有知识库以提供上下文支持。阿尔特曼在直播中自拍生成了一张AGI梗图，并分享了其对模型生成的感受。GPT-4o图像生成已陆续向Plus、Pro、Team和免费用户开放，企业和教育用户也将很快获得访问权限。与DALL·E不同，GPT-4o是原生嵌入ChatGPT的自回归模型，能够根据在线图像和文本的联合分发进行训练，生成一致且具备上下文感知的图像。然而，OpenAI也承认模型在生成图像时存在幻觉、裁剪不当和编辑不一致等问题，并已制定多种缓解策略以应对这些挑战。