Awex框架

  • 蚂蚁集团开源Awex框架,提升AI大模型训练效率

    在万亿参数大模型的训练中,权重同步耗时形成的“同步墙”正吞噬着巨额算力,数千张GPU常有超过30%的时间在等待中空转。今日,蚂蚁集团开源高性能权重交换框架Awex,将这场动辄数分钟的等待压缩至秒级,在千卡集群上实现万亿参数5-10秒同步,RDMA网络下更可降至6秒。这一突破不仅击穿了训练效率的隐形天花板,更以开源之姿重塑AI基础设施生态,标志着大模型竞争从参数规模转向系统级创新的新起点。

    业界焦点 2025年11月20日
    15