ai新贵gyrfalcon打造多款机器学习芯片-凯发88

 导读:加州大学伯克利分校的的杨博士在17年初,创建了gti公司,致力于ai芯片的研发,其公司推出的ai产品通过“存储计算一体化”的方法,使运算单元与存储器融为一体,紧邻所有运算单位的存储器使得芯片能够承担所有推理工作,无需芯片外设dram,大大降低对外存储器的利用率,降低了ai芯片的功耗,提高性能。pcm相变存储器作为非易失性存储器,拥有比nand、mram更快的读写速度,做到比mram更大的容量,可实现此架构存储器芯片的完美替代,实现成本与功效的双重结合!这也是amt基于pcm相变存储技术所要在人工智能神经网络芯片方面实现的目标之一。

内容摘取:

30年前,加州大学伯克利分校的博士生杨林(frank lin)想研发出一种特制芯片,能够加快人工智能(ai)的运算速度。2017年初建立的gti总部位于苗必达市,处于硅谷的边缘地带。gti正在一步步实现杨博士在30年前的绝妙想法:同步运算矩阵乘法的相同电路矩阵,从而加快神经网络的基本运算。gti产品致胜的关键在于其具备绝佳的能效,在性能方面胜过英特尔传统中央处理器(cpu)与nvidia图形处理器(gpu)。“我们就是对抗歌利亚的大卫。”杨林说。

gti指出,一种称为“存储计算一体化”(apim)的方法,让所有相同的运算单元与存储融为一体,可大大降低外存储器的利用率,从而大幅降低ai芯片的功率预算。2801”的运算速度可达到每秒9.3万亿次,仅耗能1瓦特,且每一次都是乘法累加运算。如今,这样“万亿次/每秒”(tops)的计算单位是ai芯片能耗常见的表示方法。它“比英特尔movidius产品的能效高90%”,杨林在谈到英特尔收购同名公司movidius时获得的推理芯片时如是说。

2801”2803”都可以在电路板上联结,并且通过外部设备高速扩展总线(pci-e)作为插件同时运行。两者均拥有嵌入式存储器,2801”可存储9兆字节。紧邻所有运算单位的存储器,使芯片能够承担几乎所有的推理工作,无需芯片外设dramgti将其称为“存储计算一体化”或“apim”“我可以一次性地将网络模型、权重与激活单元预加载到这款芯片上。”杨林说,“无需求助外部系统;这样做能够明显降低能耗,大幅提升芯片的性能。”本月,gti透露了下一产品的部分信息。该产品主要用于“物联网lot”领域,直到下个月才会正式发布。这个最新产品名为2802”,提供了另一项有趣的技术:非易失性存储器(non-volatile memory, nvm)。2802”“磁性”随机存储器(mram)替代了2801”2803”运用的静态随机存取存储器(sram)。与nand快闪存储器相似,mram在能量耗尽时不会丢失数据。这意味着一套神经网络可由客户进行预加载,甚至可以在2802”出厂前由原厂预加载。


2018年12月03日

ai新贵gyrfalcon打造多款机器学习芯片

上一篇

下一篇

ai新贵gyrfalcon打造多款机器学习芯片