ai芯片需求将推动这个“老”架构复兴!-凯发88

半导体业长期以来是将存储与处理器分别设计配置,即便是芯片内的嵌入式存储,其电路区块也是与处理单元各自分立,并让两区块间透过总线传递存取信息。

而所谓的存储内处理器(processor in memory, pim)(图1),或称存储邻近处理器(processor near memory, pnm)、存储内运算(in-memory compute, imc)等,则是在芯片电路设计时即以存储的矩阵存储电路为基础,再行加搭起运算电路,使存储与运算电路几乎融为一体。

1.左图为现行处理单元与存储间有读写(fetch提取、store存入)的瓶颈,右图为pim作法可消除运算与储存间的传输瓶颈。资料来源:ibm



深度学习需要的运算量不断提高,特别是在支援自驾车应用上,2017年nvidia提出自驾车运算平台drive px pegasus,宣称合并两张drive px pegasus可获得320tops(8位元整数)的人工智能推论运算力,目标在于支援adas标准最高的level 5自驾层级,即各种路况与情境下均能全程自动化驾驶不需人为介入,然代价是500瓦功耗,对汽车电瓶亦是不小负荷。

由于传统方式提升运算(特别是深度学习运算)效能日益困难,因此产业开始尝试回望pim技术。pim技术因存储电路与处理电路两者紧邻,传输距离短,可 快速传递运算,而深度学习所需要的「网状层次连接、节点加权运算」亦容易以pim方式实现,存储内储存的信息即是节点的权重(weight,或称特征权重),运算 后的结果再向更深层的节点传递,进行相同的乘积累加运算(简称乘加运算multiply accumulate, mac),最终得到深度学习的运算结果。

以pim方式实现深度学习运算,理论上可比传统作法更轻易达到效能提升,且是以省电方式提升,即tops/watt表现佳(类同于每瓦效能per watt performance的概念),若坚持传统作法估计只能以更大的功耗代价带来些许提升。


2.ibm运用相变存储储存神经网络中的权重  资料来源:ibm

首先为存储类型,pim必须以一种存储电路为基础发展其执行处理电路,以mythic与syntiant而言均是以嵌入式nor flash电路为主,ibm则以相变存储 (phase-change memory , pcm)为基础(图2)。由于重新启动的pim技术着重在神经网络运算,因此业者也积极尝试各种新型存储以支援执行运算设计,而不限定使用已 大宗运用的存储,如考虑mram/stt mram、rram/reram等,新兴与利基型存储于pim领域具有发展机会。



  江苏时代全芯存储科技股份有限公司(amt一直专注在相变存储领域,且与ibm保持紧密的合作关系,amt的林仲汉博士(dr. chung lam)曾担任ibm研发中心pcm项目负责人13年, 现正领导amt各地研发中心的科学家和工程师研发基于相变存储技术(pcm)的神经网络ai芯片。

end


文:新电子

排版:张乐辰

扫描二维码

关注凯发地址首页app





2019年08月07日

ai芯片需求将推动这个“老”架构复兴!

上一篇

下一篇

ai芯片需求将推动这个“老”架构复兴!