[智能分析]DeepSeek 开源周首秀:高效 MLA 解码内核 FlashMLA
在人工智能技术不断发展的今天,开源项目的推出为研究者和开发者提供了更多的工具和资源。2025年2月25日,DeepSeek 在其开源周活动中首次推出了高效的 MLA 解码内核——FlashMLA。这款内核专为 NVIDIA Hopper 架构的 GPU(如 H800 和 H100)设计,旨在提升机器学习算法的解码效率。
FlashMLA 的开发灵感源自于广受欢迎的 flash-attention 技术,目前在 GitHub 上已获得超过 7.7k 的星标,显示出其在开源社区中的广泛关注和认可。该项目的推出不...