OpenAI创始人兼CEO萨姆·阿尔特曼在谷歌发布Gemini 2.5 Pro实验版本后,迅速通过直播展示了最新的GPT-4o图像生成技术。此次升级使得图像生成更加精确,用户可以通过指令生成或编辑图像,并搭载了固有知识库以提供上下文支持。阿尔特曼在直播中自拍生成了一张AGI梗图,并分享了其对模型生成的感受。GPT-4o图像生成已陆续向Plus、Pro、Team和免费用户开放,企业和教育用户也将很快获得访问权限。与DALL·E不同,GPT-4o是原生嵌入ChatGPT的自回归模型,能够根据在线图像和文本的联合分发进行训练,生成一致且具备上下文感知的图像。然而,OpenAI也承认模型在生成图像时存在幻觉、裁剪不当和编辑不一致等问题,并已制定多种缓解策略以应对这些挑战。
赞
评论
请
登录后发表观点

