导语:为何说AlphaGo战胜李世石是个大事件? AlphaGo取得的经验可以在多个领域中得到应用。
谷歌DeepMind人工智能AlphaGo两度战胜了传奇围棋选手李世石。这是人工智能(AI)历史上的重大时刻。“我非常吃惊,”李世石说道。“我没想到会输。我没有想到AlphaGo能下得如此完美。”
然而,AlphaGo的胜利为什么会引起如此多的关注?想要真正理解该问题,就要先了解围棋的特性和DeepMind团队如何去破解围棋中的各个难点。
围棋起源于中国,是一项拥有3000年历史的抽象棋类游戏。围棋盘由19条横线19条竖线组成,棋手通过落子围住对手的棋子来获胜。虽然规则不多,但变化多端的棋路让其变得非常深奥,因为任何细微的变化都有可能引起战局的突变。
去年AlphaGo与欧洲冠军樊麾之战裁判托比·万宁(Toby Manning)表示:“围棋是世界上最为复杂的智力游戏之一。它的规则非常简单,但这些规则却导致了棋局的复杂性。”托比还引述了20世纪传奇国际象棋和围棋选手爱德华·拉斯克(Edward Lasker)的话:“国际象棋中有许多巴洛克式规则(意为华而不实),它们都是人们故意添加的,而围棋则不同,它的规则简单巧妙,有机统一,逻辑严密,如果宇宙中还有其他智慧生物,我想他们也会爱上围棋。”
正是因为围棋超凡的复杂性,棋手需要经过多年的训练,磨练自己的直觉并学习识破各种棋路,才能成为高手。“围棋一开始吸引你的是,它的规则简单易懂。它的复杂性又能让你不会感到厌倦,乐在其中,”韩国围棋协会高秘书长Lee Ha-jin说道。“即使你已经是多年的老手,你依然会发现自己还有许多新东西可学,你只希望变得更好,再更好。”
我采访过的每位围棋选手对这项运动的评价都如出一辙:围棋的魅力就在于简单规则背后的无穷变化。这些复杂的变化正是计算机程序难以掌握的地方。计算机只能通过观察棋盘获得有限的数据,下好每一步棋都需要大量直觉。
加拿大阿尔伯塔大学计算机科学家乔纳森·谢弗(Jonathan Schaeffer)说:”国际象棋和西洋棋与围棋不同,它们不需要选手对棋局做复杂的形势评估,只需一点经验,你就知道下一步该怎么走,衡量各个棋子的价值是选手最重要的任务——如果在国际象棋中多出一个’车’,那你就基本胜券在握了。但这种方法在围棋中都行不通。从人类的角度来看,围棋的棋路过于复杂多变,难以为其编程。直到AlphaGo之前,没有能创建出有效的评估函数系统。”
那么DeepMind是如何做到的呢?它使用了深度学习和类神经网络技术来学会下围棋。就像Google Photos能帮你从无数图片中找出猫咪一样,其背后是该应用对大量猫咪图片进行了像素级的分析。而AlphaGo的智能则来自对人类棋手比赛中数百万棋局和落子的学习。
让AlphaGo的棋力有了长足进步的原因是,DeepMind对它曾经练习过的棋局进行改进,让它再次练习,如此反复好几百万次,AlphaGo棋力不断强化和增进。这种方法让AlphaGo形成“策略网络”,帮助其预测对手的下一步棋,进而又形成了“价值网络”,让AlphaGo学会了确定和评估棋局。在棋局中,AlphaGo已经可以快速分析各种可能性,提前考虑后面几步的落子和排兵布阵了。上述两个神经网络让AlphaGo省去了很多工作:策略网络减小了搜索范围,价值网络让其不用自己在“心里”走完所有步骤就能得出结论。
这一增强版的学习系统让AlphaGo变得更像人类,比纯粹依靠运算能力搜索最佳走棋而战胜国际象棋大师卡斯帕罗夫的IBM深蓝电脑更加智能,深蓝所采用的方法用在围棋上根本行不通。这也是DeepMind不会在比赛间歇对AlphaGo进行调整的原因。AlphaGo只通过自学来提高棋力,单场比赛不会对自学效果产生多大影响。
DeepMind公司创始人戴密斯·哈萨比斯(Demis Hassabis)称,自从去年10月打败欧洲冠军樊麾以来AlphaGo的棋力有了进步,但由于其能力已经达到边际效益递减点,DeepMind也就没有再对硬件进行投资,所以AlphaGo的运算能力几乎没有变化。
不过深蓝电脑的开发人员认为AlphaGo在国际象棋上并不一定是世界最强。IBM研发工程师穆雷·坎贝尔(Murray Campbell)说道:“我相信DeepMind可以开发出战胜所有国际象棋大师的程序。不过我不认为AlphaGo可以在所有棋类比赛中站上世界之巅。为什么这么说呢?因为国际象棋在对搜索能力的要求上与围棋有着本质上的不同,搜索能力是深蓝战胜人类的重要因素。虽说围棋上电脑也需要深度搜索来辅助,但围棋更重视直觉和对棋局形势的判断与预估。而对国际象棋来说,除了搜索和编程,就别无他法了。”
不过DeepMind公司可不这么想,他们认为在AlphaGo上取得的经验可以在多个领域中得到应用。哈萨比斯曾讲述过深蓝电脑上的AI与AlphaGo的不同,他认为前者是狭义AI,后者是常规AI,区别在于后者更加灵活,适应性也更强。DeepMind相信,其机器学习技术将会被应用于机器人学、智能手机助手系统和医疗制度。上个月,DeepMind宣布与英国国民健康服务达成了一项协议。
其实无论随后三场比赛结果如何,AlphaGo都已经创造了历史。上周在被问及李世石被打败对围棋意味着什么时,Lee Ha-jin说:“围棋曾经是唯一一项没有被计算机打败的棋类运动,我们一直以此为荣,但现在我们再也不能这样说了,所以感到有点失望。”
不过AlphaGo的胜利也会从另一个角度推动该项运动的发展。美国围棋协会成员对AlphaGo的棋力感到十分震惊,他们认为AlphaGo有时落子的方式有些一反常规,如果自己这样下棋,肯定会被老师骂。
“我们当然非常震惊,”美国围棋协会运营副总裁杰克逊表示。“业内一直有所谓正统的落子套路,AlphaGo这样不按套路出牌能给我们带来什么启示呢?难道它要引发业界大地震?难道我们此前辛苦训练学会的那些技能都是错误的吗?”(来源:腾讯科技)
分享到: