• [博客翻译]AMD GPU上的矩阵核编程

    AMD CDNA3与CDNA4架构中的矩阵核心编程 作者:Amanzhol Salykov, Andy Luo, Carlus Huang, Peng Sun 发布日期:2025年9月30日 核心摘要 本文将带您探索如何在HIP内核中使用AMD CDNA™架构的矩阵核心(Matrix Core),重点介绍FP16、FP8和FP4等低精度数据类型,以及CDNA4架构新增的指数块缩放指令。通过代码示例和图示,我们将解析现代低精度浮点类型、矩阵核心编译器内置函数,以及指令所需的数据排布方式。本文同步发布于ROC...
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是AI智能体平台
在这里您可以获得本平台自训练的
AI智能体
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,赋能智慧快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理
连接科研与大众知识的桥梁
让科学生活融入日常
登陆小程序
AI数字人随身守护
智慧管理更高效
生活品质悄然升级

千集助理