【导读】近日,ARM 不仅宣布了最新的 Cortex-M 系列内核(最新的 Cortex M55),还引入了Ethos U55 microNPU 等改进。ARM 希望通过新的 IP,于将来几年内为数十亿低功耗嵌入式设备提升机器学习和推理能力,扩展自家产品组合,以满足新的用例需求。
过去几年,机器学习技术的应用已变得相当普及,可见其在广泛的行业和各种系统中。ARM 认为终端 AI 市场会在未来几年中迎来爆炸性增长,新 IP 就是为此做准备。
首先介绍下 Cortex-M55,它是与 M33 联系更加紧密的新一代 IP,引入了体系架构上的新改进,能够在机器学习和矢量指令方面实现较大的性能和灵活性改进。
Ethos-U55 是专用的 microNPU 推理加速器,可与 Cortex-M 系列 CPU 结合使用,带来专门面向于 NPU 的性能与能效提升。
与 Cortex-M 系列内核一样,Ethos-U55 的空间占用也比较少。至于 Cortex-M55,则是首款具有 Helium / 定制指令能力的 CPU 内核。
Helium 特指 M-Profile Vector Extension(简称 MVE),属于 M 系列 CPU 中的新矢量扩展和专用矢量执行单元,使之成为该范围内首款具有单指令多数据流(SIMD)功能的产品。
新增功能使得新内核的 DSP 性能提升了 5 倍,结合针对机器学习工作负载的优化指令和 MVE,整体表现可提高至 15 倍。
整体微架构方面,新 IP 算是继承了 M33 和 µarch 。在频率提升的加持下,它将标量工作负载的性能提升了大约 20%,具体取决于供应商的配置。
新内核的设计重点,同样体现在带宽上。其启用了需要带宽的新 MVE 和机器学习工作负载,因此对内存子系统进行了改进,比如 4×32-bit 接口与紧密耦合内存(TCM)。
尽管 ARM 进入 NPU 领域的时间相对较晚,但新推出的 Ethos-U55 microNPU,还是较嵌入式市场有着独特的意义。与移动 SoC 上更大的 Ethos-N 系列相比,它的面积和功耗要低得多。
Ethos-U55 是一种小型 NPU,可从 32 路扩展到 256 MAC、且需要与 Cortex-M 系列 NPU 耦合。
ARM 未提及微体系架构的主要细节,但可知它是一种非常精简的设计,注重的是面积和能源效率、具有较小的内存占用量,其中包含我们在 N 系列产品中见到的一些特性,如 Weight Decompression 。
即便如此,它与 N 系列在功能上并没有太大区别,因为该 IP 已包含 M 系列 CPU 。据说其架构与 NPU 有所不同(与更大的兄弟无关),且是专门为低功耗用例而设计。
就面积大小而言,U55 最小的 32 MAC 实现,约为 M55 的 2 倍。这里没有绝对的数字提供,实际上讨论的是平方毫米的分数。
与上一代解决方案相比,使用 M55 和 U55 的此类系统,其性能改进意味着相当重要的步进功能提升。与基于 Cortex-M7 的系统相比,ARM 带来了包含 50 倍的性能提升、以及 25X 的能效改进。
至于新 IP 的可用领域,ARM 展望了各式各样的嵌入式系统(主要是现有的芯片子系统)。比如在移动设备上,厂商可在手机的指纹传感器、语音助理(实时监听指令)、甚至在 RF 系统中(如天线调谐)使用它来优化工作负载。
当今的移动设备中,有数百种 M 系列 CPU 可从机器学习功能中获益,且其中大多数功能对用户来说是完全透明的。
目前 ARM 已向主要合作伙伴开放 M55 和 U55 的授权,并将在未来几个月内向更广泛的客户群开放,预计最终产品可在厂商二次开发的两年后走向市场。
推荐阅读: