借助TrueNorth,嵌入式系统可以进行深度学习推理

时间:2019-03-06 18:40:07 阅读:24次

   IBM研究院的科学家 - Almaden已经证明TrueNorth大脑启发的计算机芯片具有100万个神经元和2.56亿个突触,可以通过深度网络有效地实现推理,这些网络在几个方面达到了最先进的分类精度视觉和语音数据集。这将为从物联网,智能手机,机器人,汽车,云计算甚至超级计算等整个计算堆栈中嵌入智能提供可能性。

   TrueNorth数据集样本。

   TrueNorth处理器的新颖架构可以将图像数据分类在每秒1,200到2,600帧之间,而使用的功率仅为25到275 mW,实际上大于每瓦6,000 fps。就像电影中的功夫大师同时与来自许多对手的攻击作斗争一样,这款处理器可以同时检测50-100个摄像头的实时模式 - 每个都有32×32色像素,标准电视速率为24 fps的流媒体信息 - 在智能手机电池上运行数天而无需充电。

  这一突破本周发表在同行评审的美国国家科学院院刊(PNAS)上。该创新的本质是一种新的算法,用于训练深度网络,通过使用1位神经尖峰,低精度突触和受约束的块式连接,在神经形态体系结构(如TrueNorth)上高效运行 - 这是以前的任务被认为是困难的,如果不是,也是不可能的。神经形态深度网络的指定和训练与MatConvNet等当代深度学习系统一样易于使用,因此无需数据科学家学习TrueNorth架构的复杂性。

  “大脑启发计算的目标是提供可扩展的神经网络基板,同时接近时间,空间和能量的基本限制,”IBM研究员,脑研究,IBM研究院首席科学家Dharmendra Modha说。 / p>

  “新的里程碑提供了一个明显的概念验证,即大脑启发式计算的效率可以与深度学习的有效性相结合,为跨越移动,云和超级计算机的新一代认知计算铺平道路。”

   IBM院士Dharmendra Modha与NS16e

  今年3月,IBM向能源部劳伦斯利弗莫尔国家实验室(LLNL)展示并提供了一个放大的神经形态系统 - NS16e,它由一个16芯片的TrueNorth处理器组成。此配置旨在高效运行不适合单个TrueNorth芯片的大规模网络。 NS16e系统通过内置芯片到芯片的消息传递接口互连TrueNorth芯片,不需要额外的电路或固件,大大减少了芯片间通信的延迟和能量。

   LLNL正在研究该系统在嵌入式,低功耗应用和高速超级计算应用中的分类和识别用途。具体而言,LLNL正在研究如何使用该系统检测具有背景,杂乱和遮挡的头顶图像中的汽车;检测增材制造中的缺陷;并监督复杂的动态模拟,如工业设计中的物理问题,以避免失败。

  今天,TrueNorth开发生态系统不仅包括TrueNorth大脑启发处理器,用于训练深度网络的新颖算法和扩展的NS16e系统,还包括模拟器,编程语言,集成编程环境,库算法和应用程序,固件,教学课程,单片机和扩展系统。由此产生的生态系统正在五大洲40多所大学,政府机构和国家实验室的130多名用户中使用。

  该生态系统最初是在国防高级研究计划局(DARPA)与康奈尔大学合作的神经形态自适应塑料可扩展电子系统(SyNAPSE)计划的支持下开发的。 IBM一直在举办一系列培训活动(2015年8月在Telluride,2015年8月在IBM Almaden,2016年5月在IBM研究院 - Almaden),以使该技术得到广泛应用。有关更多信息和定期更新,请关注Modha的博客。

借助TrueNorth,嵌入式系统可以进行深度学习推理所属专题:嵌入式专题 推理专题 《借助TrueNorth,嵌入式系统可以进行深度学习推理》链接:http://www.zhouchuanxiong.net/857