华为即将发布AI推理领域突破性成果：或能降低对HBM内存依赖

华为即将发布AI推理领域突破性成果：或能降低对HBM内存依赖快讯

快科技 2025-08-10 11:51

分享到：

导读

这项成果或能降低中国AI推理对HBM（高带宽内存）技术的依赖，提升国内AI大模型推理性能，HBM的高带宽和大容量允许GPU直接访问完整模型。

快科技8月10日消息，据国内媒体报道，华为将于8月12日在2025金融AI推理应用落地与发展论坛上，发布AI推理领域的突破性技术成果。

据透露，这项成果或能降低中国AI推理对HBM（高带宽内存）技术的依赖，提升国内AI大模型推理性能，完善中国AI推理生态的关键部分。

HBM（High Bandwidth Memory，高带宽内存）是一种基于3D堆叠技术的先进DRAM解决方案，多层DRAM芯片垂直集成，显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势。

AI推理需频繁调用海量模型参数（如千亿级权重）和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型，可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型，HBM可显著提升响应速度。

当下，HBM已成为高端AI芯片的标配，训练侧渗透率接近100%，推理侧随模型复杂化加速普及。

然而，其产能紧张和美国出口限制倒逼国内厂商探索Chiplet封装、低参数模型优化等替代方案。

AI 模型推理带宽 HBM

分享到：

1.TMT观察网遵循行业规范，任何转载的稿件都会明确标注作者和来源；
2.TMT观察网的原创文章，请转载时务必注明文章作者和"来源：TMT观察网"，不尊重原创的行为TMT观察网或将追究责任；
3.作者投稿可能会经TMT观察网编辑修改或补充。