摩尔线程完成智谱GLM-5.1 Day-0适配，国产算力再提速-新品-电子元件技术网

你的位置：首页 > 新品 > 正文

摩尔线程完成智谱GLM-5.1 Day-0适配，国产算力再提速

发布时间：2026-04-09 责任编辑：lily

【导读】在国产算力与大模型协同进化的快车道上，摩尔线程再次刷新了“中国速度”。4月8日，随着智谱发布其迄今最智能的旗舰模型GLM-5.1，摩尔线程凭借自研MUSA软件栈的强大生态兼容性，在旗舰级AI训推一体GPU MTT S5000上成功实现了Day-0极速适配。这一里程碑式的合作，不仅通过PD分离架构与SGLang-MUSA推理引擎的深度调优，完美释放了GLM-5.1在长程任务与代码生成上的SOTA性能，更标志着国产全功能GPU已具备对前沿模型“从适配到部署”的全链路支撑能力，为软硬协同应对复杂AI推理场景树立了全新标杆。

GLM-5.1是智谱迄今最智能的旗舰模型，也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力，在最接近真实软件开发的SWE-bench Pro基准测试中超过GPT-5.4、Claude Opus 4.6，刷新全球最佳成绩。值得一提的是，在模型整体性能大幅提升外，GLM-5.1还在长程任务（Long Horizon Task）处理能力上实现了显著突破。和当前分钟级交互的模型不同，GLM-5.1能够在一次任务中独立、持续工作超过8小时，期间自主规划、执行、自我进化，最终交付完整的工程级成果。

针对GLM-5.1的长程任务与代码生成特性，摩尔线程基于自研MUSA架构与SGLang-MUSA、TileLang-MUSA等关键技术，完成了系统性的算子适配与推理性能调优。MTT S5000单卡AI算力（稠密）可达1000 TFLOPS，支持FP8到FP64全精度计算，其原生FP8加速显著提升推理效率；结合高效KV Cache管理，有效支撑极长上下文的显存需求；同时，PD分离架构进一步解耦Prefill与Decode阶段，降低长序列生成中的干扰，保障持续任务的高吞吐与低延迟。此外，MTT S5000提供784GB/s的卡间互联带宽，为大规模部署带来弹性扩展能力。通过软硬协同优化，MTT S5000能够稳定承接GLM-5.1的长程任务吞吐与工程级代码推理表现。

从GLM-4.7到GLM-5.1的连续“发布即适配”，绝非简单的技术迭代，而是国产AI生态成熟度的有力佐证。摩尔线程MTT S5000以千T级算力与高效的FP8加速，成功承接了GLM-5.1长达8小时的独立工作流与工程级代码推理需求，这充分证明了国产算力底座已具备与国际顶尖模型并跑的实力。未来，随着这种“国产芯+国产模”的深度耦合日益紧密，必将打破算力瓶颈，为开发者构建起一个高效、自主且繁荣的国产AI创新生态。

上一篇：告别供应商锁定！恩智浦携手生态伙伴共推高精度UWB定位普及

下一篇：效率高达93.75%！南芯科技SC8984为2-4串锂电池应用提供极致充电方案

特别推荐

技术文章更多>>

技术白皮书下载更多>>

热门搜索

摩尔线程完成智谱GLM-5.1 Day-0适配，国产算力再提速

友情链接(QQ：317243736)