日本人工智能的现状与“深层学习”的课题

科学 技术

日本的人工智能(AI)研究落后世界30年。如今很多企业都在致力于备受瞩目的“深层学习”研究,却鲜有成果值得一提。该领域缺乏相应人材,也是一大课题。

2016年3月,美国谷歌旗下的DeepMind公司开发的“阿尔法狗(AlphaGo)”实力碾压世界顶级棋手的新闻证实了人工智能的飞速进化,在全球掀起轩然大波。

“人工智能”一词说来简单,但它的历史却不算短。世界第一台电子计算机,是英国数学家艾伦・图灵在第二次世界大战期间发明的解码机。他最早的想法是开发一台能够代替人类计算者(Computer)的机器——电子计算者(Digital Computer)。电脑在诞生之初,就已经反映了人类想要制造拥有人类智能的机械的欲望。事实上人工智能的基础概念,是图灵在1947年发表的一篇论文里提出的。之后到了1956年,研究这一领域的科学家召开了“达特茅斯会议”,从此“AI(Artificial Intelligence)”这个词语才开始广为人知。顺便一提,日本的“人工智能学会”创立于1986年,起步比国外的人工智能研究晚了整整30年。

“机器学习”与“神经网络”

人工智能学会诞生的1986年,正好处于第二次AI潮的全盛期,这时讨论的人工智能概念,为方便行文,笔者权且称之为“第二代AI”。图灵时代提倡的人工智能(姑且称之为“第一代AI”)是模仿神经回路的“神经网络”(神经元之间的所有相互连接)的设想,当然它的外延更广泛一些。然而第二代AI,则是符号处理和知识信息处理成为了主流。日本便是从这个时候开始投入大量的预算,致力于开发人工智能,在此之后,包括日本在内,全球的人工智能概念已经偏向于符号处理和知识信息技术处理了。即使到现在,全球九成以上的AI研究人员都属于这种第二代AI的研究者。第二代AI的研究硕果累累,给全球技术的进步做出了巨大贡献。例如万维网(World Wide Web)就是第二代AI研究成果的应用结果,谷歌之类的搜索引擎也是如此。

然而进入21世纪,电脑的计算能力实现飞跃式提升之后,一直以来被忽略的“机器学习”领域也很快地呈现出了活力。机器学习是一种算法,它可以让计算机对特定事件的数据进行解析,从其结果中学习它的倾向,并用于以后的判断和预测。虽然这种方法早就存在,但随着计算机计算能力的不断提高,实用性的机器学习才逐步得以实现。此外,随着计算能力的提高,通过大量数据让以往学习能力弱的多层神经网络进行机器学习也成为了可能。这就是深层学习(Deep Learning)。

日本国内没有研究“深层学习”的人才

整个90年代,机器学习都处于弱势地位,所以机器学习的研究者也寥寥无几。深层学习的研究者更是少之又少。为数不多的深层学习高手纷纷被美国谷歌、脸书、微软和中国百度等企业研究所招揽至麾下。

因此如今对深层学习有着长期研究基础的专家实属凤毛麟角。这点在日本也不例外。更糟糕的是目前日本大学和研究机构可以说几乎没有搞深层学习研究的专家。

当然,受最近几年AI潮的影响,各大学和研究机构都迅速做出反应,开始致力于深层学习研究人员的培养。可惜现实却是无论在哪所大学,位高权重的教授大都是第二代AI的研究者,他们对深层学习(笔者称之为“第三代AI”)的研究能力跟初学者相差无几。机器学习的专家与深层学习的专家之间还有些微妙的见解分歧,这也给这种混乱局势雪上加霜。

举个例子,大家就能知道一直以来日本学界有多么轻视或蔑视深层学习。

2016年6月,笔者应经济产业省的邀请,在人工智能学会的全国大会上,就深层学习的分科会议做了两个企划。然而在实际给分科会议取名时,同席的学术圈研究者提出了异议。他说:“如果名字里加上深层学习的话,估计就没人来听了吧。”

这种论调听着似乎有些荒唐,但这确实就是仅仅一年前的学界对深层学习的认知。就在日本研究者裹足不前之际,欧美和中国早已夺取先机,不断有成果发表问世。

谷歌“神经网络翻译”的冲击

去年的人工智能学会全国大会上,从人数来看,参加了名字含有深层学习或机器学习的分科会议的人,确实只占全体人员的10%多一点。然而对人工智能研究者来说,去年秋天却发生了一件大事。那就是谷歌“神经网络翻译”的问世。

神经网络翻译不使用以往任何一种自然语言处理式的手法,而是仅对对译的对应关系进行学习,是一种依靠神经网络学习的翻译方法。这种看似简单粗暴的翻译方法,却有着高人一头的准确度,让研究者们大跌眼镜。

尤其是在日本,自然语言处理和机器翻译的研究占据主流。第二代AI研究者对于智能的定义是“能够对概念进行逻辑地理解和再构筑”,一直寄望于靠逻辑来解决问题。自然语言处理是通过处理自然语言,来逐步逼近人类智能的一种方法,这当然也算是一种非常有意义的研究。

然而谷歌的神经网络翻译完全放弃了这种自然语言处理的方法,而是让机器作为一个完全的黑匣子来学习语言。如果这种方法生成的译文准确度更高的话,那么一直以来致力于处理自然语言的研究者们就失去了存在的意义。

颠覆围棋AI常识的“阿尔法狗”

围棋界也发生了一件与神经网络翻译一样的大事件。正如开篇提到的,2016年3月,DeepMind公司开发的“阿尔法狗”成功击败了职业九段棋士。而这个会下围棋的AI也是用完全不同于以往的方法进行开发的。

“阿尔法狗”具有判断局势的Value-Network和判断套路的Policy-Network的双层深层神经网络。然后就是不断让它学习过去的棋谱,与自己对战,以此磨练棋艺。这种方法叫做深度强化学习,是现在的主流方法之一。

在此之前的围棋AI是通过编程写入围棋规则和定式,在很大程度上需要依赖人脑思考,下达指令,才能下棋。围棋AI的程序员会研究人类棋士如何打败对手,并结合单纯的机器学习来创造一个围棋AI高手,然而这种尝试并没有诞生出能够与职业棋士分庭抗礼的AI。

籍籍无名的DeepMind横空出世,用AI打败了人类棋士。受此刺激,多玩国(DWANGO)、百度等日本和中国的科技巨头以及业余程序员都纷纷投身AI围棋大赛。另一方面,电气通信大学从2007年起一直每年举办的“UEC杯世界电脑围棋赛”,受“阿尔法狗”战绩的影响,于2017年3月在第十届大赛上宣布停办。

DeepMind此后也不断开发和发表新技术,一直引领着世界技术发展。日本国内雅虎、多玩国或Preferred Networks等新兴势力也开始投入到深层学习的研究中,此外以丰田、FANUC为首的巨头企业也不断加大投资力度,可惜至今还没有什么值得一提的成果问世。

(2017年3月20日)

标题图片:2016年3月,美国谷歌旗下的DeepMind公司开发的“阿尔法狗(AlphaGo)”以4胜1负的成绩战胜了韩国棋手李世石(AP/Aflo)

人工智能 谷歌