Inception Labs 公司开发了全球首个商业级扩散大模型 Mercury,其生成速度比 GPT-4o Mini 和 Claude 3.5 Haiku 等常见模型快 10 倍。Mercury 在 NVIDIA H100 芯片上的处理速度超过每秒 1000 token,优于大多数需要定制 AI 芯片才能达到同样速度的大模型。尽管生成质量尚未超越顶尖模型,但其高效表现已引起关注。Mercury 采用的 Diffusion 技术与传统的 Transformer 模型不同,前者从模糊到清晰的过程大幅提升了生成速度,可能为 AI 大模型的未来发展提供新方向。
赞
评论
请
登录后发表观点