文小刚哪里人 文小刚:人机大战里的演绎智慧和创新智慧
继去年3月战胜李世石后,AlphaGo在去年年底化名Master,与包括柯洁在内的中日韩数十位高手对决,豪取60连胜无一败绩。这几天在乌镇,新版AlphaGo又与顶尖中国棋手展开新一轮大战。连胜柯洁两局,并在团体战中力克五位高手联盟的AlphaGo,对围棋的理解和直觉从何而来?机器智能的下一步该去往何方?让我们来回顾一下文小刚老师写于去年5月的文章。
撰文 文小刚
虽然人类下围棋已有上千年的历史,这几天AlphaGo和李世石的人机巅峰对决,反映了人对围棋的理解还是处于一个初级阶段,仍有提升的空间。而AlphaGo对围棋的理解已经达到了一个新的境界,能够成为人类的老师。
我们知道DeepBlue能在国际象棋上战胜人类靠的是它高速的计算能力,能在有限时间内评估所有可能走的行棋方案,从中选出一个最好的。但围棋可能走的行棋方案太多了(比国际象棋多10120倍),不可能一一评估。所以人下围棋靠的是对围棋的理解和直觉,只去评估几个到几十个比较有希望的行棋方案。这种对'比较有希望'的非逻辑性判断,我们称之为'理解'和'直觉'。
AlphaGo虽然计算能力强大,也不能用穷举法,也必须靠对围棋的理解和直觉。而这种理解和直觉,是AlphaGo里的神经网络通过实战锻炼学来的,这标志着人工智能达到了一个新的高度。AlphaGo强大的计算能力,又能使它评估比人类多很多的行棋方案。
这强大的计算能力,加上它自己学来的理解和直觉,使AlphaGo有了战胜人类的能力。(昨日第四局的对决,好像揭示了有自己理解和直觉的AlphaGo,也同时有了自己的情绪。)
当计算机在围棋上的理解和直觉,看上去已经超越人类的时候,当围棋精英开始研究学习AlphaGo的行棋风格和招数的时候,人们会想,这是不是标志着计算机的智慧已经开始超越人类的智慧?实际上,人类的智慧有很多种。这里我想主要集中讨论一下一种高级智慧,我称之为“创新智慧”(一种无中生有的智慧)。计算机会不会在创新智慧上也能超越人类?
为了解释什么是创新智慧,这里先讲一讲什么不是创新智慧。有一次,我和一个在中国顶尖大学就读的本科生聊天。他告诉我,他这辈子什么都能做到最好。他想在哪一方面做得最好,他就能在哪一方面拔尖,从来没失败过。这真是一个学霸的写照。
但我听了以后有些伤心。中国的尖子学生,怎么一辈子尽跟着别人的标准跑。别人说什么好,自己就往那方面努力,像丢了魂儿似的。可自己的思想,自己的洞察,自己的热情在什么地方?这个学生所表现的能力不是创新能力。
再讲一个例子。刚解放后的中国梦,是想要成为世界强国之一。而成为强国的标志就是钢铁产量。我小时候,每年的元旦献词,都要提到过去一年钢铁产量的发展,所以小孩儿都知道中国的钢产量是多少。1949年,中国钢产量占世界钢总产量比不到0.1%,而到1996年,已超过日本升至第1,占比也升至13.4%。现在世界钢铁生产格扃己完全变了,2013年的钢铁产量排名如下:
可见,我们现在的钢产量已远超英美,但这时钢产量几呼成了污染的指标。(看到上面的数字,我开始想象北京雾霾的来源,也有点猜测阅兵蓝、两会蓝是怎么来的。)
追求钢产量还是追着别人标准跑的心态,还是一种赶超的心态,一种复制的心态。我们现在要有自己制定标准的大气。问问我们自己到底要什么?不要总跟着别人的标准跑,要按照我们自己的标准发展,让别人跟着我们的标准跑。
这就是创新智慧。'创新'就是自己制定标准,来定义什么是'好',让别人跟着我们,向'好'的方向努力。'创新'就是就是自己制定游戏规则,让别人玩我们制定的游戏。
根据上面的解释,机器赢得围棋比赛的智慧还不完全是创新智慧。它应该更接近一种演绎智慧:也就是当给定一个规则以后,求解赢的方案。在科学中,求得一个方程的解,也是演绎智慧。但AlphaGo所表现出来的演绎智慧是相当高级的,它用到了理解和直觉。
上面我讲了两个演绎智慧的例子。下来我讲一个创新智慧的例子。
大家说人生如棋。在科学中,宇宙的演化也如一局棋。围棋的棋盘是二维的。有19x19 = 361个格点。宇宙这盘棋的棋盘是三维的。有10^61x10^61x10^61 = 10^183个格点。围棋的每个格点有三种状态:黑子,白子,无子。
所以围棋总共有3361= 10175个状态(即3361种棋子排列方式)。这是一个比天文数字还要大得多的数字。围棋的奥妙则来源于此。对比之下,宇宙的状态数是2^(10^183) 。这是一个更大的数字。这个数字大得无法想象。我都无法形象地描述这个数有多大。所以宇宙将比围棋更加奥妙得多。
宇宙的演化,就像一个正在进行的棋局。物理学家所要进行的创新研究,就是观察这盘棋的进程,来猜出这棋的游戏规则(也就是描写宇宙的理论)。实际上物理学家所遇到的挑战,比上面讲的更大。因为我们不知道这局棋的详细进程,像瞎子摸象一样,只知道一些局部模糊的进程。所以一开始,我们猜的游戏规则可能不对。当我们有更详细的观察以后,我们会发现新的更正确的游戏规则。
更有甚者,描写宇宙演化进程的语言和符号,常常都没有事先发明出来。也就是说,仅仅为了记录这些进程,我们都需要做很多创新工作。以前我们以为,只要记录了宇宙中所有粒子的位置和速度,我们就记录了宇宙的状态。但现在看来,这一观点是错误的。
现在的标准看法是,宇宙的状态是由量子场的波函数所描写的。也有人认为(包括我自己),宇宙是一个含有10183量子比特的海洋。宇宙的状态是由这些量子比特的波函数所给出的。粒子、位置、速度、量子场、波函数、量子比特,等等这些概念,都是人类无中生有的创新。
这类研究所需要的智慧就是创新智慧,人类已被证实的确具有这种创新智慧,这是人类智慧的最高点。
AlphaGo向我们展示了,计算机可以具有很高级的和很高水平的演绎智慧。这对围棋界的冲击是颠覆性的。我们人类的九段神童天才,突然要面对一个十段的非人类。但我觉得,有电脑进来,围棋领域可能会有更大的发展。电脑人脑相互激励,也许会加速提升我们对围棋的理解。我非常期待,有创新智能的电脑,能够加入到物理的研究当中来。
但现在还没有一台计算机可以具有创新智慧。可以后计算机的进一步发展,会不会使计算机也获得创新智慧?这也许才是人工智能最大的挑战。我个人认为计算机是可以具有创新智慧的。对于相信这一观点的人来说,设计一个具有创新智慧的计算机,将是一个伟大的事业。
随着近年来人工智能和生物工程的高速发展,有人预感到,人工智能和基因技术最后将改造人类自身,一部分人将成为智力和体能远超过自然人的“超人”。这些“先超起来”的人会帮助我们后超起来的人,还是奴役我们的后代,很让人担心。但不管怎么样,这恐怕是不可避免的趋势。我个人有一个不同的视角:我把'超人'看作是人类进化的一个新阶段。也就是人类可以帮助自己,加速进化。
另外,上面对演绎智慧和创新智慧的描写,也显示了中国教育体系和科技氛围的一些缺陷。在中国,我们很强调演绎能力(也就是赶超能力、山寨能力、走别人走过的路的能力)。而创新智慧、创新能力,很难在中国生根发芽,成长成林。这是中国教育政策和科技政策需要反思的地方。