你的位置:首页 > 新品 > 正文

东芝汽车应用图像识别系统级芯片集成一种深度神经网络加速器

发布时间:2019-02-28 责任编辑:wenwei

【导读】东芝成功开发出一款汽车应用图像识别系统级芯片(SoC),与东芝上一代产品相比,该产品使深度学习加速器的速度提升10倍,功率效率提高4倍[1]。该技术成果的详情于2月19日在旧金山举行的2019 IEEE国际固态电路会议(ISSCC)上公诸于众。
 
东芝汽车应用图像识别系统级芯片集成一种深度神经网络加速器
 
自动紧急刹车等先进驾驶员辅助系统可提供越来越先进的功能,但实现这些功能需要图像识别系统级芯片在低功耗条件下高速识别道路交通信号和路况。
 
深度神经网络(DNN)是模仿大脑神经网络的算法,与传统模式识别和机器学习相比,DNN的识别处理精度要高得多,预计将会在汽车应用领域得到广泛应用。而采用传统处理器的DNN图像识别耗时较长,因为它依赖大量的乘积累加(MAC)计算。同时,采用传统高速处理器的DNN还存在功耗过高问题。
 
东芝利用可在硬件上实现深度学习的DNN加速器解决了这一难题。它具有三大特点。
 
● 并行MAC单元。DNN处理需要大量MAC计算。东芝的新设备配有四个处理器,每个处理器包含256个MAC单元。因此提高了DNN的处理速度。
 
● 减少了动态随机存取存储器(DRAM)存取。传统的系统级芯片没有本地内存,无法在靠近DNN执行单元的位置保存临时数据,并且在访问本地内存时产生较大功耗。同时,加载用于MAC计算的加权数据也会产生较大功耗。东芝新设备可在DNN执行单元附近执行静态随机存取存储器(SRAM),并将DNN处理分为多个子处理块,因此可将临时数据保存在SRAM内,从而减少了DRAM存取。此外,东芝还在加速器上增加了一个解压缩单元。可通过解压缩单元加载预先压缩并存储在DRAM中的加权数据。因此,降低了加载来自DRAM的加权数据时产生的功耗。
 
● 减少了SRAM存取。传统深度学习需要在处理DNN的每一层之后访问DRAM,因此功耗过高。该加速器在DNN的DNN执行单元中设计有流水线层结构,以便在一次SRAM存取期间执行一系列DNN计算。
新系统级芯片符合全球汽车应用功能安全标准ISO26262的要求。
 
东芝将继续提高所开发的系统级芯片的功率效率和处理速度,且东芝下一代图像识别处理器ViscontiTM5的样品发货将于今年九月启动。
 
 
[1]东芝在2015 IEEE国际固态电路会议上发表的一篇论文《面向图像识别应用采用基于颜色的对象分类加速器的1.9TOPS与564GOPS/W异构多核系统级芯片》中提及的图像识别系统级芯片
 
 
推荐阅读:
 
华为发布OceanStor Dorado系列全闪存存储新品
Microchip推出业界首款支持Type-C的车载USB 3.1 SmartHub
Qualcomm推出Quick Charge无线快速充电并引入Qi互通性
Qualcomm推出车用Wi-Fi 6芯片,为顶级车载体验提供更强大功能
凌华科技推出专为列车控制和轨道信号而设计的专用智能屏
特别推荐
技术文章更多>>
技术白皮书下载更多>>
热门搜索
 

关闭

 

关闭