2025年6月20日,华为开发者大会(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布,基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线。这一被业内称为“算力核弹”的技术,以384张昇腾算力卡组成单体超节点,算力规模达300PFlops,较英伟达NVL72提升67%,标志着国产AI算力在集群效能与系统架构上实现全面突破。
技术突破:从单卡到超节点的范式革命
传统AI服务器通常包含8张算力卡,节点间通信效率低,难以支撑大模型训练需求。华为CloudMatrix 384通过全对等互联架构,将384颗昇腾NPU与192颗鲲鹏CPU通过高速网络MatrixLink全连接,形成一台逻辑上的“超级AI服务器”。其核心创新包括:
- 超高速互联:采用6812个400G光模块,实现2.8Tbps卡间互联带宽,断点恢复时间仅10秒级;
- 集群扩展能力:单超节点可扩展至万卡级集群,支持构建16万卡算力网络,满足准万亿参数模型训练需求;
- 能效优化:尽管单卡功耗较高,但通过系统级架构创新,昇腾AI云服务大模型训练作业可稳定运行40天,打破行业“算力焦虑”。
性能对标:单卡吞吐量比肩H100,模型精度无损
第三方实测显示,基于CloudMatrix 384的昇腾云服务在DeepSeek-R1模型部署中,单卡Decode吞吐突破1920Tokens/s,达到H100部署性能水平,且模型精度与官方一致。此外,华为盘古大模型通过通算掩盖、全局动态均衡等技术,实现昇腾亲和的高效训推系统,训练MFU(模型利用率)和单卡推理吞吐量业界领先。
生态赋能:从算力到应用的“全链智能”
华为云以CloudMatrix 384为核心,构建覆盖芯片、框架(MindSpore)、工具链(ModelArts)的自主创新全栈服务,并推出“AI全家桶”生态:
- GaussDB数据库:支持实时AI推理与数据融合;
- CodeArts开发工具链:提供一站式AI模型开发环境;
- MetaStudio数字内容生产线:加速AI生成内容(AIGC)商业化落地。
微博COO王巍现场分享案例,基于昇腾AI云服务的“评论罗伯特”AI助手,在热搜流量高峰期可实现30秒内扩充八千核算力,确保平台稳定运行。
行业影响:打破“算力霸权”,重构全球AI格局
华为CloudMatrix 384的商用,标志着国产AI算力从“追赶”转向“引领”。英伟达CEO黄仁勋近期公开承认,华为在超节点技术上已超越英伟达,并呼吁美国政府放宽出口管制以应对竞争。而华为则通过“用数学补物理”“非摩尔定律补摩尔定律”等策略,在芯片工艺受限背景下,以系统架构创新实现算力突破。
目前,华为云已在全球33个地理区域、96个可用区部署算力节点,构建国内30ms、海外50ms时延圈,为行业提供“即开即用”的AI算力服务。张平安表示,华为云将持续投入超节点与集群技术研发,推动AI普惠平权,为全球AI产业提供“中国方案”。
结语
华为CloudMatrix 384的全面上线,不仅是一次技术突破,更是国产AI算力从“单点突围”到“系统升维”的战略跃迁。在AI大模型训练需求指数级增长的背景下,这一“算力核弹”或将重构全球AI产业竞争格局,为行业智能化转型注入新动能。
关于文章版权的声明:
https://news.softunis.com/40865.html 文章来自软盟资讯
若非本站原创的文章,特别作如下声明:
本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。不承担任何由于内容的合法性及真实性所引起的争议和法律责任。
凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。
如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!
