2025世界人工智能大会(WAIC)上,摩尔线程创新性提出“AI工厂”理念,旨在构建新一代 AI 训练基础设施,应对生成式 AI 爆发下的大模型训练效率瓶颈。而全功能国产GPU是摩尔线程“AI工厂”的核心支撑,也是其技术突破的关键所在。正是以其为底座,摩尔线程夸娥(KUAE)智算集群带来了为行业提供了突破传统算力瓶颈的国产化解决方案。
效率优先:全栈集成加速算力部署
传统模式下,企业构建AI算力平台,耗时漫长,需要分别采购硬件、搭建网络存储、部署管理软件,通常3-6个月左右。而夸娥智算集群颠覆了这一流程,采用一体化交付模式,将计算集群、高速RDMA网络、分布式存储等基础设施与集群管理平台(KUAE Platform)和模型服务平台(KUAE ModelStudio)深度预集成,大大加速了集群部署效率。
在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升。通过5D大规模分布式并行计算技术,摩尔线程自研夸娥计算集群实现了上千节点的高效协作,不仅推动AI基础设施从单点优化迈向系统级创新突破,也构成了“AI工厂”优化集群效率的技术优势。
稳定如山:保障大规模训练连续高效
大规模AI训练对系统稳定性要求一向十分严格,即便是千卡甚至万卡规模的集群,也经常出现硬件故障,然而传统处理方式恢复训练动辄数小时。
基于全功能国产GPU打造的夸娥智算集群却不一样,通过分钟级故障定位、检查点(Checkpoint)百GB级数据秒级存储、训练任务分钟级恢复、“零中断”容错技术等多项创新设计,实现了“月级”长稳训练能力,不仅创造了连续稳定训练30天以上的记录,周均训练有效率也成功保持在了99%以上。
生态无界:无缝迁移加速应用创新
“AI工厂”的快速落地还需自主生态的进一步繁荣与发展。而夸娥智算集群通过夸娥模型服务平台(KUAE ModelStudio)大幅降低生态迁移门槛,支持从大模型预训练、微调到推理部署的全流程支持,并提供API一键部署功能,极大简化模型开发和上线流程。
同时,其还通过Musify代码移植工具可快速将现有CUDA代码自动迁移到摩尔线程MUSA架构,实现代码零成本移植,用户仅需针对性优化热点代码,大幅降低学习成本和迁移周期。
“AI工厂”理念的提出不仅充分展现了摩尔线程在全功能国产GPU领域的深厚积累,更以系统级创新定义新一代AI基础设施,为AGI时代的到来奠定了更为坚实的算力基础。

微信扫一扫打赏
支付宝扫一扫打赏