人工智能的火热,被今年3月份AlphaGo与李世石的围棋大战推向高潮,本次IBM人工智能芯片的“生物神经元”、“人脑工作方式”等“高大上”属性更是引起了业界的广泛关注。关于类脑计算谁将主导未来趋势呢?
神经元芯片不属于生物神经网络范畴
英特尔中国研究院前院长吴甘沙告诉记者,关于类脑计算,现在也没有一个广为接受的定义,但现在基本可以看到两个方向,人工神经网络从功能层面模仿大脑的能力,而神经拟态计算(neuromorphic computing)则是从结构层面去逼近大脑,其结构也有两个层次,一是神经网络层面,与之相应的是神经拟态架构和处理器,二是神经元层面,与之相应的是元器件。
大家还可以看到其他的一些名词,比如脑启发计算(brain inspired computing),基本都是在上述层次里游移。IBM刚刚宣布的人工神经元即是在神经拟态计算方向,在神经元结构层面做出的努力。
“我们称IBM关注的这类模型为‘脉冲神经网络’。”北京中科寒武纪科技有限公司创始人兼CEO陈天石在接受记者采访时指出,“IBM在人造神经元方面的工作,是以新器件的方式直接模仿脉冲神经元的行为,与其前期推出的TrueNorth是一脉相承的。我们不认为它是生物神经网络,而只是理论神经科学家的一种数学模型。但生物的神经网络究竟是什么样,神经科学家都还是一知半解,IBM现在就开始模仿,可能为时过早。”
寒武纪科技的两个创始人均是中国科学院脑科学与智能技术卓越创新中心的成员,该中心是由世界顶尖神经科学家,美国科学院院士、中国科学院外籍院士蒲慕明教授组建的,挑选了中国科学院最优秀的脑科学和智能技术专家组建,一直密切关注着神经科学的前沿动态。
“从新闻报道的内容来看,IBM推出的人造神经元是属于脉冲型神经网络的一款芯片。”作为成功量产中国首款嵌入式神经网络处理器芯片的企业,中星微电子集团首席技术官张韵东的看法与陈天石相同。
作为人工神经网络的一种,卷积神经网络CNN 是当前人工智能机器视觉领域的研究热点。
张韵东进一步指出,IBM人工神经元与卷积神经网络处理器芯片(如中星微的“星光智能一号”)相比,共同之处是,都是属于受到生物人脑机理的启发而通过半导体电路与器件去实现的,都是采用CMOS半导体工艺来生产的。而不同之处在于,所采用的架构和实现方式不同,前者采用脉冲型架构,用数模混合电路来实现;后者采用卷积型架构,用数据驱动的并行数字电路来实现。
人工神经网络技术更被看好?
由此看来,不管是叫神经拟态计算,还是叫脉冲神经网络,IBM的这种技术路线是和人工神经网络并行的一种技术路线。那么,两种路线孰优孰劣?
张韵东更看好人工神经网络。他认为,卷积神经网络与软件开发环境的结合更加紧密,更加易于编程,易于商用化。
陈天石也认为,目前为止,脉冲神经网络与人工神经网络相比,尚有很大差距。
他举例道,脉冲神经网络无法做大尺度的图像识别,即使是做简单的手写数字识别,其识别精度也还没有上世纪80年代流行的多层感知机(经典的人工神经网络)做得好。
我们知道,寒武纪科技和中星微电子都是国内致力于人工神经网络技术路线的企业,他们对IBM人造神经元的看法是否会偏颇?
IEEE“神经网络先锋奖”获得者、Facebook人工智能实验室负责人、人工智能深度学习权威Yann LeCun此前的评论我们可以参考。
对TrueNorth以及IBM一直关注的脉冲神经网络,Yann LeCun说:“这类网络没有在任何有意思的问题上表现出与当前最好技术(指人工神经网络深度学习技术)接近的结果”。
回答得有点迂回,但表达的意思基本清楚。
脉冲神经网络芯片商业化还需要好几年
条条大路通罗马。不同技术路线的存在,也自有其生存的土壤。
人工神经网络是从算法向硬件发展的。吴甘沙告诉记者,传统的算法在通用芯片(CPU和GPU)上效率不高,于是出现了特定的算法加速器,来加速包括卷积神经网络、递归神经网络在内的各种神经网络算法。比如Teradeep,它来源于Yann LeCun(上文提到的深度学习大神)的工作NeuFlow,已经实现了商业化。
中国科学院计算技术研究所寒武纪系列芯片在知识产权布局上非常独到,也开始了商业化的探索。谷歌的TPU(Tensor Processing Unit)也是一种专用的加速器芯片,跟其深度学习软件Tensor Flow匹配。就中短期而言,这类芯片有很好的商业化前景。
对于神经拟态芯片,常常见诸媒体的是架构和处理器层面的进展。吴甘沙提出,IBM的TrueNorth芯片和高通的Zeroth芯片,两者都基于脉冲神经网络。TrueNorth发源于DARPA的SyNAPSE,展示了在100mW功耗下模拟复杂的递归神经网络的能力,体现了这一架构的独特之处(但也有人指出功耗优势来自较低的主频)。Zeroth的商业试用并不成功,目前已转向人工神经网络加速器。
英特尔也在做脉冲神经网络的芯片,估计商业化还需要好几年。即便如此,各家公司还是投入重兵,因为它所代表的新型处理范式——计算与记忆的一体化、复杂互联、递归、时空编码、异步、低精度、随机性、高容错等特征,有很高的研究价值。例如,生物神经元有很多突触连接,这在硅芯片上很难实现。另外,传统的CPU和GPU都是同步的,实现神经拟态需要异步电路。
“所以说,另一种思路是在器件方面得到突破,比如DARPA UPSIDE基于模拟芯片,有些类脑芯片基于忆阻器(memristor),以及IBM刚刚宣布的人工神经元,所有这些都比传统的晶体管更容易实现类脑计算。”吴甘沙强调。
“IBM的神经元新器件对脉冲神经网络的硬件实现有很大帮助,但这类模型在算法方面尚有很长的路要走。”陈天石表示,“未来也许会有突破,但近年不乐观。”
实际上,对于人工神经元芯片的问世,IBM自身也是非常清醒的。他们在指出“这些相变神经元是我们到目前为止所创造出的行为最接近生物神经元的人工器件”的同时,也强调将面临“更难的部分——编写一些能够真正利用该芯片的神经形态的软件”。
但正如IBM所说:“我们没有任何理由止步于此。”