3月19日,在第10届UEC杯世界计算机围棋赛上,决赛中由腾讯AI Lab(腾讯人工智能实验室)研发的围棋人工智能程序“绝艺”(Fine Art)击败日本开发的“DeepZenGo”(天顶),以11战全胜的战绩夺冠。
今年共有30支软件参加此次大赛。继18日的循环积分赛中,“绝艺”以七局全胜战绩进入16强后,在今天决赛又以四连胜战绩夺得本届UEC杯冠军,日本“DeepZenGo”获亚军。
这次比赛其实也邀请了AlphaGo,但被他们拒绝了。参赛的围棋程序大都是学习2016年DeepMind的那篇论文,而现在的AlphaGo又再度进化升级,成为更为强大的“Master”了。与参赛的围棋程序相比,现在的AlphaGo可能已经是不同“物种”了,自然没必要参赛。
比赛的用时是每方30分钟,平均下来20秒左右就要落子,参赛程序的计算能力显然对比赛成绩有着很大的影响。比赛并不是所有的程序都使用统一的硬件配置,而是各自通过手里的笔记本电脑,把比赛数据发送到各自的服务器计算平台上完成。这也是为什么18日现场断网之后,比赛不得不暂停的原因。
应用了深度学习技术的围棋程序,对局时策略网络和价值网络同时工作,还要配备强大GPU等计算资源。虽然计算资源堆积到一定程度之后能起到的提升效果有限,但在UEC的快棋赛制里,计算资源上的差别还是很有影响的。
DeepZenGo是由日本最大的视频网站作为技术支持,而绝艺的背景是腾讯,两者在计算资源上的优势是显而易见的。据国内一位研究围棋AI的同学介绍,绝艺能够调用的计算资源大到无法想象,毕竟中国是目前超算能力最强的国家。
绝艺、DeepZenGo,还有此前新浪棋牌报道过的 “丽拉”,都是受到2016年DeepMind在《自然》杂志上发表的关于AlphaGo论文启发,进而发展成现在的围棋人工智能的。从某种意义上讲,它们都是去年那个AlphaGo的跟随者。从这次世界计算机大赛的棋谱体现出的水平来看,他们距离去年击败李世石的那一版AlphaGo似乎还有一定的差距。
这个差距一方面来自于,当时AlphaGo与李世石下的是慢棋,计算时间比这次要长;另外一方面可能是谷歌在深度学习技术应用上的优势所致。不过尤其要注意的是,现在这些围棋程序对比的对象还只是2016年与李世石大战的AlphaGo,现在的AlphaGo(或者说MAster)究竟进化到什么程度我们并不知道。
DeepMind在公布科学成果上是很谨慎的。去年人机大战之前他们说AlphaGo通过自我对弈,取得了巨大的进步,所以才有信心挑战李世石。当时不少人对此嗤之以鼻,结果被4比1的比分打了脸。
2016年11月的时候,AlphaGo团队的发言人樊麾通过微博宣布:“我们很高兴向大家宣布,AlphaGo的棋力在已过半年有巨大的进步,将在2017年初复出下棋。我们团队会在近期内公布更多讯息。”这个“巨大进步”耐人寻味,AlphaGo的研究又取得了怎样的进展呢?之后Master在网上的60盘快棋测试,让我们惊鸿一瞥。计算时间极短、完美的局面掌控、精准的局部战斗,这些细节都告诉着我们,现在的AlphaGo或者说Master,已经和一年前的它完全不同了,甚至可能已经进化到了一个更为先进的阶段。
上一次AlphaGo公布研究结果,改变了整个围棋人工智能领域,为围棋界打开了一道通往未来的大门。不久前,哈萨比斯说:“2017年将是AlphaGo与棋界兴奋的一年”,这次他们会带来什么样的惊喜呢?
稿源:新浪体育