从“上海发布”到“上海方案”：国产全栈自主光互连超节点迈入规模商用-新品-电子元件技术网

你的位置：首页 > 新品 > 正文

从“上海发布”到“上海方案”：国产全栈自主光互连超节点迈入规模商用

发布时间：2026-03-12 责任编辑：lily

【导读】在今日开幕的中国家电及消费电子博览会（AWE）上，上海仪电联合曦智科技、壁仞科技及中兴通讯重磅发布了“光跃超节点128卡商用版”（LightSphere 128）。这一里程碑式的发布，标志着中国原创的光互连光交换超节点解决方案在短短半年多时间内，成功完成了从概念验证到实际商用的跨越。作为首个国产光互连光交换GPU超节点方案，它集成了全球首创的硅光OCS芯片、自主大算力GPU液冷模组及高性能AI服务器软件平台，不仅实现了数千卡的规模部署，更以微秒级模型切换延迟和降低90%以上的传输延迟，为国产智算集群树立了全栈自主的新范式。

光跃超节点128卡商用版正式落地

从“上海发布”到“上海方案”，国产光互连光交换超节点迈入规模商用阶段

自2025年世界人工智能大会首次发布以来，光跃超节点历经半年多联合攻关，成功实现128卡商用版落地。作为国内首个光互连光交换GPU超节点解决方案，这项诞生于上海、成长于上海的原创技术成果，以曦智科技全球首创的硅光OCS光交换芯片为核心，搭载壁仞科技自主原创架构的大算力通用GPU液冷模组壁砺166L，并集成中兴通讯高性能AI服务器及自研软件平台，构建起全栈自主的智算集群新范式。

实测数据显示：在同等规模下训练DeepSeek V3 671B模型时，光跃超节点128商用版的训练性能较非超节点集群显著提升，模型切换延迟低至微秒级，传输延迟相较传统电交换降低90%以上。目前，该超节点已成功适配阶跃星辰全系列模型（包括Step3.5 Turbo），以及DeepSeek、Minimax、Kimi、GLM等主流大模型，有效缩短了大模型的训练时长和推理延迟，可为用户提供高性价比、高能效的国产算力解决方案。光跃超节点128商用版已实现长期稳定训练状态。

三大技术亮点，重构智算集群效能边界

作为此次AWE的明星展品，光跃超节点128卡商用版呈现三大原创技术突破：

1.全球首创硅光OCS光交换芯片，重塑超节点架构

光跃超节点基于曦智科技全球首创的硅光OCS光交换芯片，突破单机柜功耗与物理互连瓶颈，实现跨机柜GPU万卡级弹性扩展；同时，拓扑实时重构能力可按模型负载的通信需求动态调整超节点规模与GPU互连拓扑，故障场景下秒级完成拓扑切换，显著降低GPU冗余成本；此外，光交换技术不依赖于特定的数据传输协议，可无缝兼容不同厂商使用的互连协议，消除生态锁闭风险；更关键的是，硅光OCS芯片基于硅光技术，其设计与制造完全不依赖先进半导体工艺节点，从根源上提升了算力基础设施供应链的安全性与韧性。

2.全栈自主原创大算力GPU液冷模组，提供强劲训推算能

光跃超节点搭载壁仞科技“壁砺™ 166L”自主原创架构大算力通用GPU液冷模组。该模组单卡BF16算力，通过多计算芯粒（Chiplet）与CoWoS 2.5D先进封装协同设计，搭配革新载板互连技术，实现超高密度算力输出。同时，高效的液冷方案显著提升超节点的能效比与系统稳定性，为大规模智算集群建设构筑强大、安全、可靠的算力底座。

3.自研软件平台灵活配置超节点网络，高效适配大模型负载

光跃超节点依托中兴通讯自研软件系统，实现对各类大模型需求的广泛适配，并可按模型特征动态完成算力拓扑的切换和算力资源的精细调度。基于全局资源可观测体系，系统能够实现故障节点的秒级替换与分钟级断点续训，为大模型训练提供高可靠保障。通过软硬协同的系统级工程优化，光跃超节点的光互连优势被充分转化为性能、效率与可扩展性的全面提升。

光跃超节点128卡商用版的成功落地，不仅是“上海方案”在人工智能基础设施领域的重大突破，更通过三大原创技术——全球首创的硅光OCS光交换芯片、全栈自主的大算力GPU液冷模组以及灵活高效的自研软件平台，彻底重构了智算集群的效能边界。该方案在显著提升DeepSeek等主流大模型训练性能的同时，凭借不依赖先进制程的供应链安全优势、极高的能效比以及秒级故障恢复能力，有效解决了算力扩展瓶颈与生态锁闭风险。

上一篇：搭载片上MRAM与S32K5 MCU：恩智浦Z248解锁超快OTA与实时响应能力

下一篇：突破 DDR5-10266 极限！技嘉 CQDIMM 双槽架构如何实现 256GB 大容量与高频并存？

特别推荐

技术文章更多>>

技术白皮书下载更多>>

热门搜索

从“上海发布”到“上海方案”：国产全栈自主光互连超节点迈入规模商用

友情链接(QQ：317243736)