【导读】在未来某个时间点,数据中心网络方面的性能提升必然会到达一个天花板,届时摩尔定律将失效。为了规避这个问题,很多研发工作正在进行中。例如在交换机和路由器ASIC碰壁的时候,我们就应该利用硅光子技术来帮助提高网络设备的密度和能效,以便我们继续建立网络。
在未来某个时间点,数据中心网络方面的性能提升必然会到达一个天花板,届时摩尔定律将失效。为了规避这个问题,很多研发工作正在进行中。例如在交换机和路由器ASIC碰壁的时候,我们就应该利用硅光子技术来帮助提高网络设备的密度和能效,以便我们继续建立网络。
作为业界的领头羊,英特尔从事硅光子学研究已久,而其连接小组的成员则由前Barefoot Networks首席执行官Craig Barratt领导(英特尔于去年6月收购了该公司以建立其以太网交换业务),他们正在炫耀一些现在刚刚商业化的技术。按照他们的规划,其将光学器件和硅光子学封装在一起的技术即将进入市场。英特尔Connectivity Group内的硅光子产品部门(SPPD)总经理Hong Hou和Barefoot Networks部门总经理Ed Doe向我们介绍了Intel和Barefoot的一些进展。
近年来 随着应用变得更加分散和相互依赖(不仅由于容器,而且肯定会因容器而加剧),数据中心内部网络的带宽需求和基数也呈爆炸式增长。如下图所示 :
这种数据增长正在引起数据中心中的各种问题。
以典型的超大规模数据中心为例。Hou告诉The Next Platform,在这情况下,系统拥有超过100,000台服务器和50,000多个交换机。这可能比构建超大规模应用所采用的大规模Clos架构所需的交换机数量要多得多。
但在Hou看来,自从他在英特尔从事硅光子技术业务以来,他所关心的是,这些超大规模数据中心之一需要超过100万个光收发器,这些光收发器并不便宜。占了数据中心基础架构不小成本。统计显示,将节点连接到交换机和交换机之间的光纤线末端的光收发器在超大规模数据中心上的花费在1.5亿美元至2.5亿美元之间,然后将它们运营的所有数据中心加起来,这实际上开始每年每年仅在光收发器上的花费就增加了数十亿美元。顺便说一下,这些光收发器约占这些数据中心整体网络预算的60%,超过交换机,NIC和电缆等设备的总和。
Hou表示,这些数字有些波动,具体取决于公司,但是显然随着带宽需求的增长和实际对光收发器的需求,需求也在不断增长,但同时也伴生了一个问题。
Hou解释说:“这些光收发器都需要在几个月内就具有一致性和可扩展性,以使云服务提供商能够调试数据中心,将其投入服务并产生收入。” “传统的精品光学器件使用分立元件,因此无法提供如此快的制造可扩展性。而且,为了满足这种水平的客户需求,对于传统的光学供应商而言,资本支出可能太重了。”这与英特尔已经提出五年多的观点一致。
为了解决以上问题,英特尔从二十多年前就开始进行硅光子学研究,直到2016年,公司才将其第一批硅光子光学收发器投入使用,并一直在悄然提高产量。到2018年底,它已经出货了第一百万台,到2019年底,它已经卖出了300万台,仅在2020年第一季度就计划再增加50万台,保持每年200万台的速度。以下是英特尔生产的两种不同的硅光子光学收发器:
第一个是100G PSM4 QSFP,在并行单模光纤上具有2公里的距离,并且在发射器芯片上具有磷化铟层,该层实现了四个混合激光器和用于将电信号转换为光的调制器和光电检测器以将光转换为电信号。该设备显然支持100 Gb /秒的速度。最新的100G CWDM4 QSFP光收发器使用双工单模光纤,并使用载波分割多路复用(carrier wave division multiplexing )来获取相同激光器/调制器电路的输出,并在该单根光纤上首先100 Gb / sec的带宽。它的最大可达距离为10公里,可以选择500米和2公里。
后一个收发器中的片上激光器额定温度在-40摄氏度至85摄氏度之间,这意味着它可以在设备保持干燥但不一定与现代数据中心处于相同温度的广泛室外环境中使用,Hou说,更重要的是,与其他供应商提供的行业标准光学收发器相比,这些新型收发器的缺陷率大约为百万分之二十八,与现有的竞争对手的百万分之一千相比,有很大的提升。Hou表示,超大规模者,云构建者,电信公司和服务提供商不喜欢维修或更换设备,因此产生了共鸣,这就是为什么英特尔在单模光纤100 Gb /秒光收发器中拥有第一的市场份额的原因。
从上面的路线图中可以看出,英特尔目前正在开发其200G FR4和400G DR4光学收发器,顾名思义,它们将支持以200 Gb /秒和400 Gb /秒运行的端口。这些将在今年启动并扩大。
但是最终,您真正想要做的是在交换机ASIC封装上安装硅光子端口,在交换机端整合收发器,尽管英特尔没有讨论这一点,但是您可以在服务器NIC端做同样的事情SmartNIC设计中也带有大量CPU或FPGA。
大约八个月前,在Barefoot Networks被收购之后,英特尔连通性部门的交换机和硅光子学人员开始这样做,使用“ Tofino 2”交换机ASIC在交换机上测试了这一想法,这个chiplet设计的芯片总带宽为12.8 Tb / sec。而Tofino 2芯片被共同封装的100 Gb / sec光学tiles所包围:
该特定的Tofino 2交换机设置为可驱动400 Gb / sec端口,并且重要的是,仅由于交换机ASIC上集成了收发器电路,这种集成将使整体网络成本降低约30%,功耗降低30%。
这比使用在交换机机架中具有外部激光器的光开关要好得多(比在交换机前面板中具有重定时器将其挂接到交换机ASIC中的光模块要好得多)。因为他们拥有更加搞的密度和更加低的功耗。通过降低功耗,现在可以更快地实现开关ASIC上的SerDes加速,然后将所有组件的速度提高两倍。
英特尔演示的光子引擎运行速度为1.6 Tb /秒(使用PAM4编码的16个通道以100 Gb /秒的速度运行),但可扩展到每瓦3.2 Tb /秒,这意味着可以在未来的Tofino芯片上进行前端处理具有25.6 Tb /秒,51.2 Tb /秒,甚至102.4 Tb /秒的总交换带宽。Tofino 2芯片没有100 Gb / sec的SerDes,但是后续的Tofino NG芯片可能会在今年晚些时候面市,而其后续的两款产品也将面世。在开关电路达到摩尔定律极限之前,这可能是最后一个速度提升到更快的SerDes(100 GHz,用PAM4编码)。将光学器件与硅光子学集成将成为关键,并且可以肯定地将其与100 GHz SerDes的速度相结合,并且可能与后来的50 GHz的下一代产品相提并论。
考虑到所有这些,在光学器件上节省功耗和金钱将意味着允许开关ASIC烧得更热,变得更大,而这将需要在5纳米或3纳米世代左右进行。这样,开关/收发器综合体的整体散热和成本仍将在成本和散热方面下降,这就像英特尔所主张的那样,是使摩尔定律得以维持的一种方式。
免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理。