2016-10-28

人工智能是怎么下围棋的?

当前因为谷歌AlphaGo对战李世石的胜利,引发了一场人工智能热。人工智能是如何下棋的?人工智能下围棋和下其他棋类又有什么区别?

首先,计算机下棋是很简单的事情,以象棋为例,专家只要给出一个评估函数,就可以告诉计算机怎么评估一个棋局。评估函数是人的主观给的,当然在很多棋局里,专家还要给出黑方比较优还是红方比较优。所以所谓的计算机下象棋,或者说人工智能分析评估函数,只需要在数据里进行搜索。当然这个搜索量很大,像中国象棋,一开始的每一步都有几十种选择,变成平方、立方,下去搜索会非常大。

但计算机下围棋却是很难的事情,因为这其中有一个很大的挑战:估值函数无法获得。围棋即使在没有棋子的情况下,也可以摆两方,只有正负一的差距,估值无法和象棋一样用子粒的多少判断。此外,围棋是19×19很大的平面上进行,那么计算机需要的搜索状态非常大。计算机下围棋虽然很苦难,但也有一个很有意思的办法,就是把当前的棋局作为一幅图,当然这个图上每个信息不能只是当前落子的情况,还包括之后的许多局面可能性。系统先输入当前网络上可获得的所有职业选手大概16万盘棋的数据,用图象分析的分类问题,就可以针对当前的盘面输出一个值,即判断下一步应该下在哪,基于大量的数据,往往就能取得一个很好的对弈结果。用这样的方法下围棋,其实在很多年前就已经可以达到比一个业余6段的选手还要强。因此我们可以说围棋也是可以看做是一种图像识别。

当然,这里可以抛出一个问题,即这种用大量数据训练出来的系统(例如AlphaGo),是否并非真正的“智”,而是一种蛮力,一种“伪智能”?

认知时代下的深度学习及其局限性

深度学习在过去五六年里,在很多领域得到广泛应用。尤其在多媒体领域,例如做图像分类或者做语音识别,深度学习的低错误率在海量数据存在的情况下,甚至已经超过了人的水平,这一点是很了不起的。我们可以看到,原来系统是把很多逻辑、内容事先编进程序,而现在,因为有了例如深度学习一样的新的方法,在一个充满大数据的领域,这个系统自然可以随着数据的增多而不断的聪明起来,不断变得更优。所以我们IBM觉得,认知时代到来了,这是一个全新的维度。

当然,深度学习还有很多的局限性。以AlphaGo为例,它在比赛时系统有几千个CPI,GPU功耗是非常高的。并且,这种以海量的数据为基础并从当中试图构建一种数据的可扩展性的行为,实际上不能算是真正的智能,是一种大数据的智能或者是伪智能。而即使是这种大数据的智能,我们现在的计算机体系架构上还是有很大的局限性,对于类似图象视频里的模式识别方面,如果基于现在单计算核心方式是很难有效工作的,系统在处理和分析一个多媒体数据仍然存在许多问题。

IBM在这方面有一个项目SyNAPSE,它可以做图象视频识别,它的功率可以跟脑几乎在一个数量级或者多一个数量级,几十毫瓦的功耗可以做到实时视频的分析,虽然距离彻底解决问题仍然很远,但这已经是很大的进步了,因为它可以在较低耗能的情况下让计算机在很多场景下做实时的图象视频分析,比如海啸的预警,以及在人迹罕至的森林里火警的预报,这些都是非常有意义的方向。

多模态数据分析及商业应用前景

从现实的商务环境里或者从商务应用方面考虑,其实很多数据来源不是一种形态的,也就是所谓的“多模态数据”。举一个简单的例子,以往去医院拿的病例上医生写的那些字经常很难看懂,但是现在都是电子化,病人在系统里有其文本病例信息,即数字型数据,也有在CT、核磁方面的很多视频流数据数据等等,医生在给病人做相关的病情分析或诊断时,就有多模态的数据来提供支持,而不只是一维数据的分析。这就类似与我们做馒头,光有面粉是不够的,还需要一点酵母、水,这些不同的元素有机结合在一起,最后才能把馒头发起来,并且,还需要给它一些时间。

当前有很多视频分析或图象分析的技术虽然做得很好,但最终只是成为一篇论文或者一个专利,止步不前,不知道什么时候可以利用。其实利用多模态数据分析的技术可以产生很多的应用场景,同时这方面的技术发展非常快,通常两三年就是一个周期。目前IBM就做了许多这方面的尝试,例如上述提到的医疗方向,IBM在纽约就利用多模态数据分析进行了癌症分析:用基因测试数据,通过对文档中数据的判断,分析一些蛋白或者是化合物之间的关联,从而给每位病人做个性化的交流。同时,在澳大利亚,我们根据多模态数据分析做了一个系统,可以通过图象可以判断小动物皮肤癌癌变的概率有多大,这些都是很好的应用场景。

因为有大数据的存在,以海量的多模态的数据作为基础,很多应用即使系统分析能力有待完善,也仍然能够提供给用户很好的结果。因此,技术结合数据,将多样数据进行融合,将会给行业带来很大的变化!

一问一答:人机大战给了我什么启示?

现场提问:当前AlphaGo引起了业界人工智能热,这个热也引燃了一些投资热,而投资热也算是良莠不齐。同时,像您上面提过的,它用了大量的GPU,消耗的功利是超负荷的,所以阿尔法狗背后引起功率的消耗会引起一系列资源的浪费、能源的消耗,甚至环境的污染等一系列恶劣影响。还有一个问题,即AlphaGo如果像那李世石样只消耗20瓦功耗的话,还能不能战胜人?这个方面又引发的一系列讨论,还引燃了大家对于人工智能未来恐慌的讨论。结合以上几个方面,请问此次人机大战给您最大的启示是什么。

苏中:首先下棋这个事情不稀奇,在上个世纪60年代,IBM一个机器学习领域鼻祖(阿瑟·塞缪尔,机器学习之父)就编制了一个下棋程序,通过机器人与人对弈西洋跳棋并打败了人。过了二三十年,人们可能遗忘了,现在又有了机器人下围棋热。计算机下棋这种问题从某种角度上迟早会解决,但这并非等同于人的思路或者真正的智能。人的本能更像是智能的表现,而后天学习的东西机器都会比我们强,只是极限的情况下需要切换到人。

其次关于人工智能热,其实人工智能热了冷了,每隔十年二十年都会来一次,这个也很正常。这次人工智能热应该感谢互联网,互联网给人工智能带来了很好的应用场景。所以最本质上来讲还是要看有没有好的应用推进它,有了好的应用,再加上大数据的存在,应该讲这个方向会越发展越健康,当你有了应用环境就有了立足点。

最后,智能会不会真的很可怕?其实也不可怕。我们在做数据模型时虽然有一定的扩展能力,但是有局限,跟采样有关。计算机下棋是根据之前职业选手对局的数据来产生的结果,把当前在网络中可以获得的所有职业选手对局的数据都进行分析,这就是AlphaGo学习的能力,但这其实是有盲点的。如果有一个选手特别厉害,或者吴清源还活着,他下棋跟别的流派不一样,大数据可能很容易输给他。所以基于大数据的智能大家不用担心,但是关于上面提到的耗能问题,确实是需要大家去想的。当前整个计算机系统本质上是投入产出比,一个大的数据中心现在计算存储的价格越来越低,耗能可能是数据中心里很大的,这方面需要我们做很多研究。有了那么多功耗,还要散热,这其实也给我们提出一个新的机会,就是有没有新的计算架构可以更好有效的解决这个问题?这个方向是一个更好的前景。我们现在已经看到很多很大的应用,能够装到手机里,能够实时的视频编解码,还有做各种各样的分析。所以耗能问题会有更好的解决模式出现,我相信那一天不会太远。(完)

猜你喜欢

分享至手机

扫码关注FMCI