12-摩尔线程以全功能国产GPU为底座，打造“AI工厂”理念重要载体c

2025世界人工智能大会(WAIC)上,摩尔线程创新性提出“AI工厂”理念,旨在构建新一代 AI 训练基础设施,应对生成式 AI 爆发下的大模型训练效率瓶颈。而全功能国产GPU是摩尔线程“AI工厂”的核心支撑,也是其技术突破的关键所在。正是以其为底座,摩尔线程夸娥(KUAE)智算集群带来了为行业提供了突破传统算力瓶颈的国产化解决方案。

效率优先:全栈集成加速算力部署

传统模式下,企业构建AI算力平台,耗时漫长,需要分别采购硬件、搭建网络存储、部署管理软件,通常3-6个月左右。而夸娥智算集群颠覆了这一流程,采用一体化交付模式,将计算集群、高速RDMA网络、分布式存储等基础设施与集群管理平台(KUAE Platform)和模型服务平台(KUAE ModelStudio)深度预集成,大大加速了集群部署效率。

在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升。通过5D大规模分布式并行计算技术,摩尔线程自研夸娥计算集群实现了上千节点的高效协作,不仅推动AI基础设施从单点优化迈向系统级创新突破,也构成了“AI工厂”优化集群效率的技术优势。

稳定如山:保障大规模训练连续高效

大规模AI训练对系统稳定性要求一向十分严格,即便是千卡甚至万卡规模的集群,也经常出现硬件故障,然而传统处理方式恢复训练动辄数小时。

基于全功能国产GPU打造的夸娥智算集群却不一样,通过分钟级故障定位、检查点(Checkpoint)百GB级数据秒级存储、训练任务分钟级恢复、“零中断”容错技术等多项创新设计,实现了“月级”长稳训练能力,不仅创造了连续稳定训练30天以上的记录,周均训练有效率也成功保持在了99%以上。

生态无界:无缝迁移加速应用创新

“AI工厂”的快速落地还需自主生态的进一步繁荣与发展。而夸娥智算集群通过夸娥模型服务平台(KUAE ModelStudio)大幅降低生态迁移门槛,支持从大模型预训练、微调到推理部署的全流程支持,并提供API一键部署功能,极大简化模型开发和上线流程。

同时,其还通过Musify代码移植工具可快速将现有CUDA代码自动迁移到摩尔线程MUSA架构,实现代码零成本移植,用户仅需针对性优化热点代码,大幅降低学习成本和迁移周期。

“AI工厂”理念的提出不仅充分展现了摩尔线程在全功能国产GPU领域的深厚积累,更以系统级创新定义新一代AI基础设施,为AGI时代的到来奠定了更为坚实的算力基础。

扫一扫打开手机网站

微信扫一扫关注我们

12-摩尔线程以全功能国产GPU为底座，打造“AI工厂”理念重要载体c

联系我们

给这篇文章的作者打赏

为您推荐

为什么出发时刚好能塞满的20寸行李箱，返程时总是合不上？

​时效与服务双优，跨越速运用硬实力积累好口碑

2026小家电品牌实力一览：知名品牌排行榜+选购指南

​高端速运实力解析：跨越速运与顺丰行业优势深度解读

不同集团与曹操出行达成战略合作，以AI切入高端家庭生活的新入口

压实安全责任 筑牢发展屏障——平安产险宁阳支公司扎实开展2026年“安全生产宣传月”活动

联系我们

时效与服务双优，跨越速运用硬实力积累好口碑

高端速运实力解析：跨越速运与顺丰行业优势深度解读

压实安全责任筑牢发展屏障——平安产险宁阳支公司扎实开展2026年“安全生产宣传月”活动