-月光博客

2016年2月13日星期六

支付宝春晚互动：79万人集齐五福平分2.15亿红包

　　2月8日消息，作为央视2016年春晚独家互动平台，支付宝为全球华人送上了一场“咻红包传福气”的春节大戏，四轮拼手气红包，加上零点后的集齐五福平分大奖，红包总金额高达8亿。数据显示，除夕夜，支付宝“咻一咻”互动平台的总参与次数达到了惊人的3245亿次，是去年春晚互动次数的29.5倍!让许多网友望穿秋水的“敬业福”终于也有了着落，最终，有791,405位用户集齐了五福，平分了2.15亿的大奖。

　　“咻一咻”成“年的声音” 3245亿次收听引发全民狂欢

　　在春晚进行当中，支付宝“咻一咻”互动平台总参与次数达到3245亿次，是去年春晚红包互动次数的29.5倍，在21点09分，用户的参与热情达到了顶峰，“咻一咻”峰值达到210亿次/分钟。

　　从地区分布看，三四线城市的参与用户占比达到了64%，明显超过了一二线城市，在中小城市中，江西赣州、河南周口、山西运城位列前三，他们和北上广的观众一样，成为了春晚抢红包的主力。

　　这一方面是因为过去一年，移动支付跨越地理鸿沟在全国范围进一步普及，更多人因而有机会接触“指尖上的红包”，另一方面，受到春运影响，大量一二线城市的打工族们回老家过年，也带动了三四线城市地区的用户活跃。

　　79万用户集齐五福福气通过手机传递全球

　　在今年的春晚上，让许多网友望穿秋水的“敬业福”终于有了着落，最终，有791,405位用户集齐了五福，平分了2.15亿的大奖，平均每人得到271.66元，赢得了一份开年彩头。

　　实际上，自支付宝公布春晚五福玩法之后，为了集齐福卡，大量用户在支付宝上加好友、换福卡、发红包。有网友笑称，一张“敬业福”让全国人民都换上了“强迫症”，七八年不见的同学、老友因为福卡而重新联系，也成了这段时间的常事。

　　在过去一周，“敬业福”频频登上多个社交平台的热门榜单，成为2016年第一个全民网络热词。

　　值得注意的是，参与的用户中，并非仅仅是80后、90后这样的年轻人，50后、60后、70后也跟着自己的儿女晚辈一起传递福卡，他们占到了总参与用户的15%，有超过三成的用户，在除夕选择将福卡传递给父母家人，一家人一起集齐福卡。

　　“中国人过年讲求的是团聚，这次互动形式的创意，最主要考虑的就是增加亲朋好友之间的互动性，让大家过年不再只是低头看手机，也多与家人、朋友交流互动，在福气传递中共享天伦，”支付宝春晚互动负责人易扬说。

　　除了增加家庭互动，福卡还让相隔万里的人们多了一种送福的方式。这个除夕，总计有208个国家和地区的用户参与了福卡互动，福卡传递最远的距离是从阿根廷到中国，直线距离达到20,000公里，足足跨越半个地球。

　　11亿对好友相互传递快乐小红包带来大想象

　　1月28日，支付宝官方宣布，用户新加10个好友即可获得三张福卡，而在除夕当天的活动中，人们也能通过“咻一咻”获得福卡，通过福卡的积累和好友交换，集齐五张的用户即可平分2.15亿的现金大红包。

　　从去年7月引入“朋友”一级入口开始，支付宝一直在实名账号体系之上搭建基于信用的实名关系链，它无论对于互联网金融还是O2O，都有着巨大价值。

　　对支付宝而言，聊天工具并不是其目标，支付宝也不会为了做社交而做社交，“金融服务离不开场景。”蚂蚁金服集团支付事业群总裁樊治铭说，“大量的关系链，使得金融服务有机会深入到移动金融更多的场景中去，将成为各个金融场景的粘合剂和催化剂”。

　　支付宝目前的产品设置已经为金融场景的扩展打下基础，在支付宝上，好友可以方便地进行金融产品的互相赠送与推荐，分享和讨论淘宝天猫的商品，收取班费、AA付款，用亲情账户为孩子设立教育基金，这些日常、实在的金融服务，用户都可以在支付宝内便捷完成。

　　“春晚效应”体现媒体融合创造出更大的社会价值

　　“红包习俗加上移动互联网，让除夕这个团聚的时刻也成为了一个非常欢乐、繁荣的经济时点。”中央财经大学中国互联网经济研究院教授欧阳日辉评论说。在中国人口大量聚合的时刻，红包互动让品牌商与用户加强连接，而这些连接在接下来的春节假日和此后的经济活动中将直接转化为消费，并拉动内需。

　　央视方面的设计也体现出媒体融合的智慧，把娱乐互动与主流价值观教育有机结合，用爱国、敬业、友善、和谐、富强命名五张福卡，借助春晚这一最具影响力的平台，通过电视大屏与手机小屏的互动，正能量价值观在全国亿万观众中的进行了一次范围最广、到达率最高、印象最深刻的传播。

　　互动传播原本是新兴互联网媒体的优势和立足点，由于春晚的推动，现在电视已经成为最大的互动传播平台。过去一年来，央视媒体融合驶入快车道，按照“TV+新媒体”的思路，探索“电视+”与“互联网+”的契合点。

　　稿源：环球网

2016年2月8日星期一

Facebook总裁扎克伯格视频恭祝春节快乐

　　2月7日午间消息，Facebook CEO马克·扎克伯格（Mark Zuckerberg）今天在Facebook个人页面上发布消息，向用户致以农历新年的问候。

　　扎克伯格表示：“普里西拉、麦柯斯和我祝大家农历新年快乐！在猴年中，祝愿你们和所有你们的爱人开心、健康、好运。”

　　扎克伯格及其妻子普里西拉·陈和女儿麦柯斯共同拍摄了一段视频。以下是扎克伯格和普里西拉·陈在视频中的致辞：

　　大家好，新年快乐！今年能和Max一起庆祝新年，我和Priscilla非常兴奋。我们希望你也正在和你的家人朋友一起庆祝。昨晚是Facebook的年度春节晚会。很荣幸的，我们今年有几位从中国来的大厨。他们让Facebook的员工吃上了中国各大菜系的美食。我最喜欢的是烤鸭。为了庆祝新年，我们全家人在一起吃了团圆饭。这个新年，对Max也是很有意义的，因为我们为她取了中文名字。她的中文名字叫陈明宇。陈是妈妈的姓，明是明天的明，宇是宇宙的宇。明宇是代表希望世界的未来更美好。最后，我们这个小家想祝福大家，身体健康、阖家幸福、猴年大吉。

Twitter将推算法时间线

　　据BuzzFeed网站报道称，Twitter计划最早下周对消息流的展示方式进行调整，推出基于算法的时间线。

　　未来，Twitter消息将基于算法，按照对用户的相关性，而非时间逆序来排列。目前尚不清楚，Twitter是会强制用户转向新的消息流，还是将新的消息排序方式作为一种选项提供给用户。

　　BuzzFeed去年6月曾刊文称，基于算法的时间线将帮助Twitter更好地展示热门内容，解决Twitter消息中“信噪比”的问题。

　　自去年10月出任Twitter正式CEO以来，杰克·多西(Jack Dorsey)曾多次表示，将重新思考Twitter平台的核心原则。

　　多西去年7月表示：“我们正继续质疑自己的基础，为更多人开发更简单、更易用的产品。”去年11月，Twitter放弃了“收藏”选项，代之以“点赞”。如果调整消息流的排序方式，那么这将成为多西领导下Twitter最大的变革。此外近期还有传闻称，Twitter消息将取消140个字符数的限制。

　　Twitter此前已在一小部分用户中测试了基于算法的时间线。目前看来，这一测试进展顺利，而Twitter即将把这一功能开放给所有用户。

腾讯推出付费入QQ群功能

　　高级付费服务是各行业的大势所趋，腾讯QQ在这方面无疑是一把好手。近日，QQ群的付费入群功能也悄然开通了。这是QQ加群的第一个付费方式，用户申请入群时，需要向群主支付一定的费用才行，金额为1-20元范围内的整数，由群主设定。值得一提的是，用户付费后就能直接加入群，不在需要群主或管理员的审核。

　　目前QQ群开启收费功能需要满足几个条件：

　　1、群等级不低于LV2

　　2、群信用星级不低于5星

　　3、群主QQ等级不低于LV12

　　目前，PC版、手机版QQ均已开放此功能。

　　具体的开启方法是：进入群资料卡—管理群—加群方式—将群的加群方式更改未“付费入群”；设置加群费用：仅限1-20元，且只能设置为整数；群成员支付后即可入群；

　　注意：付费入群无需验证，支付费用后即可入群，不需要群主或管理员确认。

　　群成员支付的进群费用将在次日转账至群主QQ钱包余额。腾讯表示，这种付费加群方式适合资源分享、教程、学习等类型的群。

　　目前，这一功能在PC端QQ和手机QQ上均可开启，但只有群主可开通此功能。付费入群的金额在1-20元范围内。为了防止恶意用户违规牟利，要开通“付费入群”功能，QQ群必须同时满足群等级大于等于LV2、信用星级5星、群主QQ等级大于等于LV12等三个条件。

　　其实早在去年10月，腾讯公司副总裁殷宇就曾透露，QQ群支付结算功能已经在小范围进行了测试，在一个以中老年为会员的“广场舞”QQ群里，群友们每天都很热情分享广场舞视频，学习交流，当有人跳得好时，其他群友就踊跃花1元钱购买虚拟“小红花”送上，仅这个业务目前每月流水都上百万元。而这次QQ群付费入群功能全面推出，对于腾讯来说是一种营销上的创新。

　　事实上，腾讯之所以推出这个付费入群的功能，一个很重要的目的就是为了试水商业化。

　　长期以来，网络社群的商业化都是一个难题，豆瓣、知乎以及更早的天涯多年来都一直不温不火。目前，大部分社群网站以及移动应用都通过广告的方式变现，但是这样方式并不能长远：一来有伤用户体验，二来天花板不高，也很难展开其他商业模式的尝试。

　　而在腾讯看来，QQ群“付费入群”功能可以妥善解决这些弊端。这个功能一方面可以让群主在QQ群平台中获得更多高价值的成员，使群内生态更加健康；另一方面也将持续激励群主更好地运营、经营Q群，创造更多、更具价值的内容。

　　当然，付费入群可以激活一些有活力和有分享价值的群，比如VIP客户群、教程或知识传播的资源群、收集讲授费用的培训群、聚集了知名人物的人脉群，不难想象，引入付费机制之后，群主对于群组的管理会更用心，QQ群内部的内容运营也会更加精细化。

　　当然既然有好处也肯定有坏处，QQ付费群带来商机的同时也带了危机。一些以营收为目的的传播色情视频的不良商家，可能会通过付费入群这个功能大量复制和传播，例如“十元进群你懂的”“付费群+群视频+AA 收款的群广告信息也是屡见不鲜。QQ群开放收费之后，无疑给这些人提供了更多的便利。这对腾讯来说是一个考验。

苹果升级以旧换新计划

　　苹果公司重新升级了iPhone以旧换新计划，消费者可用显示屏、摄像头或Home键受损的iPhone以旧换新。而此前，有硬件损坏的iPhone不能参与官方的旧换新活动。

　　去年，苹果上线了以旧换新服务计划，允许用户将旧款iPhone折价以购买新款iPhone，但这项计划自推出以来一直都不适用于显示屏、摄像头或Home键损坏的iPhone。但从本周开始，升级后的计划将允许苹果零售店为这些部件合理损坏的 iPhone 5s、iPhone 6和iPhone 6Plus给予以旧换新积分。

　　以旧换新再次上线

　　在苹果官网上，这次以旧换新服务的官方描述是“Apple重复使用和循环利用计划”，用户可使用老款iPhone换购新iPhone，最高可折价2500元。与过去相同，最新的iPhone 6S尚不在该服务支持列表名单中。

　　本次升级换购新iPhone有两种操作方式：一种是用户带上iPhone前往Apple Store零售店，现场即可通过折抵优惠来购买新iPhone；另一种是用户通过在线表格告诉苹果自己设备的信息，苹果的合作伙伴将会对设备的折价进行评估，然后用户需要邮递自己的设备给苹果相关部门，不久之后，可通过银行转账的方式收到折抵款项。需要说明的是，苹果备注的这个合作伙伴正是曾经售卖官方翻新二手iPhone的爱锋派。

　　除了iPhone手机之外，用户还可以带上iPad前往苹果的官方零售店，或者是通过苹果的重复使用及循环利用合作伙伴进行在线评估获得优惠。

　　据了解，早在去年3月苹果就在官网上正式上线了以旧换新服务，但不知什么原因，该服务在运行一段时间之后就下线了。北京商报记者就此事联系到苹果相关负责人，但截至发稿，该负责人并未给出答复。

　　低折旧价遭吐槽

　　然而，苹果此次的折旧价格依然没得到消费者的认可，不管是苹果的经典机型iPhone 4S，还是将苹果带到巅峰的机型iPhone 6，苹果官方给出的换购价都很低，很多网友都是抱着看热闹的心态评论此事，大都表示不愿以如此低的价格换购新产品。

　　在价格方面，国行iPhone 4S只能折价300元，iPhone 5为500元，iPhone 5S为950元，16GB版iPhone 6为1850元，16GB版iPhone 6 Plus为2200元。与中关村二手回收价相比，苹果官方的回收价要低很多。以16GB版iPhone 6 Plus为例，中关村二手市场的回收价为3550元，两者相差超过1000元。

　　其实去年苹果的以旧换新要求也很严苛，一部旧手机只能换一部新手机，参与机型同样不包括最新款。其中，iPhone 4回收价为250元，iPhone 4S回收价为500元，iPhone 5S回收价为1500元。以iPhone 5S为例，中关村二手回收价为2500元，苹果官方的回收价只有1500元，但该款手机再次出手的价格是几乎相同的，所以苹果公司的利润会多出1000元。通信世界周刊总编刘启诚分析认为，苹果在制定折旧价格标准时，肯定要考虑成本和利润的问题，折旧价越高，苹果的利润率就越低。

　　不仅仅是 iPhone，用户还可以带上 iPad 前往苹果的官方零售店，又或者是通过苹果的重复使用及循环利用合作伙伴进行在线评估，苹果官网点此跳转。

2016年2月2日星期二

陈经：谷歌围棋算法存在缺陷达不到人类最高水平

　　2016年1月28日，谷歌围棋程序AlphaGo以5：0战胜职业棋手的消息，震动了围棋圈。这两天有很多的讨论，主要是新闻性的。我也在第一时间进行了常识性的介绍。

　　本文进一步从围棋和人工智能技术的角度，深入分析AlphaGo棋艺特点，评估其算法框架的潜能，预测与人类最高水平棋手的胜负。下文中出现的策略网络、价值网络、蒙特卡洛法请参考前文，理解具体围棋局面也需要一定的棋力，但是与算法推理相关的内容理解起来并不难。

　　AlphaGo是如何下棋的

　　所有人，包括职业棋手，看了AlphaGo战胜樊麾二段的五盘棋，都说这程序下得像人了，和以前的程序完全不同。柯洁九段（公认目前最强棋手，一年获得三个世界冠军，对李世石6：2，古力7：0）的看法是：

　　“完全看不出来。这五盘棋我也仔细地看了一眼，但我没看名字，不知道谁执黑谁执白，完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃，该退出的地方也会退出，非常均衡的一个棋风，真是看不出来出自程序之手。因为之前的ZEN那样的程序，经常会莫名其妙的抽风，突然跑到一个无关紧要的地方下棋。它这个不会。它知道哪个地方重要，会在重要的地方下棋，不会突然短路。这一点是非常厉害的。”

连笑七段让四子对DolBaram，看看电脑是如何搞笑的。

　　先来看我上一篇文章中提到的DolBaram被连环劫搞昏的局面。右下角白是连环劫净活，电脑却不知道，耗费了很多劫材来回打。这是因为电脑是用蒙特卡洛树形搜索（MCTS）下的，一直模拟下到终局，看各个选择的获胜概率。人一眼就知道打劫是没用的，你提这个我必然提回那个。电脑模拟时的选点却不会只有那一招，就会发现，如果对手不提另一个劫走了别的，那电脑就能吃角了，所以就去提劫。直到劫材损光，电脑才会恍然大悟，吃不掉，但这已经过去几十手，超过电脑的搜索能力了。

2014年日本UEC杯软件决赛，Zen执黑对CrazyStone。

　　再来看Zen和CrazyStone两个过去最强的程序间的一个局面。黑61威胁白右上角和中上，白却不应，在下面62切断，黑继续63吃掉右上角。最后白在上面损失惨重，为了救中上几个白子，下面又被黑先动手，没有收益。为什么CrazyStone不应上面？因为程序没有价值的概念。白不应上面，黑要把白右上吃掉，还需要很多手，中上的白子活不活更不好说，这已经超出了电脑蒙特卡洛模拟的能力。因为电脑不知道要对着上面猛算，它不知道上面是焦点，可能花了很多计算在下面或者其它地方，认为62手下面切断胜算更大，上面的损失它模拟得不对。这个局面能说明蒙特卡洛树形搜索法（MCTS）的局限性，这个弱点很要命。

　　那么AlphaGo会如何解决这两个问题？连环劫问题，DolBaram可能得打个补丁。AlphaGo也是基于MCTS的，但是它的策略网络是深度学习高手对局的招法训练出来的，更为准确，有可能提劫这手就不会给多大概率，因为高手们面对这个局面不会去提劫。另一种可能是，AlphaGo有一个价值网络，不用来回打一堆劫就能直接判断下一招后，获胜机会如何。由于价值网络是训练出来的，包含了3000万局的最终结果，对于右下那块白棋的死活是有判断的。当然也可能AlphaGo针对连环劫有补丁。

　　CrazyStone犯错这个图，假设AlphaGo执白，在考虑第62手。61、62、63这些着手显然都会在AlphaGo的策略网络的选点中。你要让它用MCTS模拟出右上和中上白棋几个子是怎么回事，估计也是不行的，手数和分支太多。因为这不是一个简单的死活问题，白可以不要一部分甚至都不要，只要在其它地方有足够的补偿。但是AlphaGo有价值网络，它会在模拟到63手时，用价值网络快速评估一下，发觉白必败，于是迅速否定62这手棋，在上面下棋。因为价值网络的3000万个样本中，上面这种白棋类似棋形导致失败的棋局会有一些。

　　这里我们看出来，AlphaGo相比前一代软件的革命性进步，是有了一个价值网络。实际上，AlphaGo可以不用搜索，直接用策略网络给出一些选点，用价值网络判断这些选点的价值，选一个最好的作为着手，就可以做出一个非常厉害的程序。这个简单程序就可以打败其它软件，达到KGS（一个围棋网，人工智能程序一般在上面打级） 7D，这是非常惊人的。Facebook的Darkforest也可以不搜索，用策略网络给出一些选点，选其中概率最大的点（最像是高手下的那招棋），这样可以达到KGS 3D。在此基础上再加上MCTS，把Darkforest提升到了5D。这说明AlphaGo的价值网络对棋力提升的价值，可能比MCTS还要大。

　　有了高效的价值网络，AlphaGo就容易知道局面的焦点在哪，不会在非关键的地方走。可以预期，其它软件开发者要跟上AlphaGo，就得把价值网络搞出来。但是这非常难，需要模拟海量的对局，对局水平还不能低，需要的投入很大。

　　AlphaGo想要战胜业余高手，策略网络、价值网络就够了。但要战胜业余顶尖，就还得加上MCTS。这相当于对策略网络、价值网络的选择，进行验算。策略网络有两个，一个是给出当前局面的选点，一个是在MCTS模拟中快速给出一些选点。价值网络给出判断，有价值的搜得深。整个决策过程非常象人类高手的思维过程了：面对局面，给出一些选点；然后对各个选点推演下去，有的推几步就判断不行终止，有的会推得很远；有时算不清，就根据感觉下；有时没时间，直接感觉，都不推理了。

　　所以AlphaGo的算法框架很强大，和人类高手很像。而且它没有情绪波动，每一步都会稳定地用MCTS进行验算，人类不一定做得到。樊麾二段就是败在这上面，不少着都没有仔细验算，冲动地下了被AlphaGo反击吃大亏。

　　AlphaGo还不如人类高手的地方

　　分析AlphaGo的弈棋算法，可以相信，AlphaGo到了一定的局面以后就是必胜，因为它不会在此后犯错。实际之前的Zen、CrazyStone也是这样，到了后盘必胜局面，就靠MCTS，它们都能知道必胜了。这时电脑会下得特别猥琐，“赢棋不闹事”，胜多胜少一样。而人类高手后半盘胜局被翻盘很常见，官子没时间算清楚，稳定性比电脑差得多。

　　樊麾对AlphaGo的第二局就有这样一个局面。AlphaGo执黑，由于在右下角大占便宜，这时已经必胜了。黑下135，放白136活（如破上面的眼，白借O16的连出再做出一眼）。中韩职业高手刘星七段和金明完四段都指出，黑135右移一路，下在O18，是能够杀死白棋的。

参考图

　　但是AlphaGo为什么不下？我们可以试着推理一下，如果黑强杀，接下来局面会是这样：

　　黑135下三角一着强杀，白提一子，黑137退。白138先手切断右上黑棋，虽然是靠劫。接下来白有ABC甚至更多“捣乱”的方法，但职业棋手一眼就能看出来，白的捣乱必然失败，因为白角也没几口气，还要撑劫，黑肯定能对付。但是AlphaGo作不出这种推理！

参考图

　　刘星说，AlphaGo肯定知道白是死的，但选择了稳当的下法。笔者认为恐怕不是这样。AlphaGo的搜索框架里，并不一定能断定白是死的，因为需要的手数不少，打劫虽然更不利于白，但增加了推理手数。它并没有一个搜索任务叫“杀死白右上角”。如果硬要去这么搜索是做得到的，但是如果它这样去想问题，棋力反而会下降，因为围棋很复杂，杀棋付出代价太多会败。AlphaGo推理时会发现，放活白，100%胜，杀白，有风险（虽然实际没风险，但它很可能没去算）。所以AlphaGo集中搜索放活的必胜下法，最后选择是放活。如果局面是不杀不胜，那AlphaGo就会发现其它招不行早早放弃，就会去集中算杀棋的那些招。

　　也就是说，一些对于人类非常明显的死活，对AlphaGo反而是麻烦的。人类高手在这个局面很可能就去吃棋让对手早点认输，因为没有任何风险。AlphaGo就不行，它没有分配足够的计算资源去算这个死活，而是去算它认为胜率更高的分支，这些分支要消耗非常多的MCTS局面。人类一眼能看出来的死活，AlphaGo却需要“足够”的计算资源才能算出来。有时因为局面的焦点问题，它还真就分配不出来。只有其它分支不行，被价值网络与MCTS早早砍掉，这块棋的死活才会获得足够资源算个通透。

　　这不会影响AlphaGo的胜利，但已经可以看出，它的思维其实和人不一样。它并不是一定能算清的，只有你逼得它没办法了，它才会去算清。但是人就有优势了，人看一眼就知道结果，AlphaGo以及基于MCTS的这些程序，都得去算不少步才知道。程序并不像人一样，对于棋块能给出结论。人给出结论需要计算，但是算一次就行了，然后就一直引用那个结论，直到条件变化。但是程序得去算，算到死了才是死，有一些局面计算甚至是活的，它只是概率性地在那选择，并没有给出确定性的结论。

　　再看一个局面，第三局樊麾执黑对AlphaGo。金明完四段指出白60扳，62打，都是走在黑空里的损着。还不只是亏空，本来白不走，右中的白棋粘在S7位，是有一个眼的，现在没有眼了，对中间的攻防战影响不小。

参考图

　　这是AlphaGo确定无疑的亏损错着。但是证明这个结论，需要黑能够对付白Q3长捣乱，要杀掉白右下。职业棋手也要花一点时间，但不难。结论是，因为中下的黑子够厚，所以没有棋。要是没有H4J4这两个黑子，就有棋了。这里涉及到的手数和分支是不少的，虽然结论是明确的。下面是一个白捣乱失败的参考图。

参考图

　　对于AlphaGo来说，这个局面就很麻烦了。如果逼得它不得不做活，它会用MCTS一直模拟下去，最后认为还是死。但现在局面还很空旷，局面选点很多，它并不知道去开一个“任务”算右下角的死活。

　　在很多高手对局里，类似这个角的局面就是有棋的，甚至没有棋，高手也会下类似60这样的棋“留余味”，例子很多。所以AlphaGo的策略网络会给出60这个选点。但是高手会迅速否定掉60，因为做不活，而且会损右中白棋的眼。

　　AlphaGo不会有“损眼”这种概念，它得模拟到很多步以后，才能知道右中的后手眼很关键。60提出来以后，MCTS救不了它，因为手数和分支太多。价值网络也救不了它，因为这里死了，白也只是吃了亏，并不是明显败局。价值网络背后的3000万局里，60及其后续捣乱手段可能出现过不少胜局，会给60这招一个好分。

　　这里我们能看出来AlphaGo的巨大不足了，它对于围棋中的很多“常识”其实是没有概念的，例如“后手眼”、“先手眼”，“厚薄”。有一定水平的人类棋手都明白围棋概念很多，开发者根本就没有准备去建立这些概念，而是自己想了一个决策过程。表面上看AlphaGo和人类高手一样先选点，再推理验算，但这只是表面的相似，内在机理是完全不同的。

　　AlphaGo的策略网络可能和人类最高手没有水平差别，甚至更厉害都可能，因为可以考虑更多选择。但是接下来的价值网络和MCTS验算的区别就大了。人类高手是进行复杂的概念推理，大多数情况下可以把“棋理”讲清楚，为什么这么选择，几个变化图就够了，高手们就取得了一致。但AlphaGo是不行的，它只能死算。在封闭局面，死算表现是很稳定，超过人类高手。但是在前半盘的开放局面，它不知道去算什么，其实也是东一下西一下没有逻辑地在那撞运气地推理。

　　由于围棋的复杂性，它增多推理的局面数并不能带来多高的棋力提升。Distributed AlphaGo（1202个CPU，176个GPU）的计算能力是“单机版”AlphaGo（48个CPU，8个GPU）的很多倍，但互下只有78%的胜率。

　　我们可以得出一个重要结论：

　　在早期的开放局面或者中间复杂局面中，AlphaGo的算法有时会走出明显吃小亏的错招，如果“思考”时需要较多的手数与搜索分支，就可能超过它的搜索能力。而人类高手能看出来程序的错误，有能力避免这类错，因为会进行高级的概念推理。这是人类高手的巨大优势。

　　为什么AlphaGo的这个弱点表现得并不明显？这是因为开发者用各种办法进行了“掩盖”，而且对手必须很强才行。这个弱点只对高手才存在，甚至象樊麾这样的职业二段都无关紧要。这局樊麾根本没利用白棋损了一眼这个错误，自己先在中间行棋过分被抓住。人类对手面对的各种考验更多，局部出了错被AlphaGo一通死算抓住就锁定败局完蛋。人类对手需要自己先稳住，不能出“不可挽回”的错着。就算是顶尖职业高手也不一定做得到，之所以出了错在职业圈里胜率还可以，是因为对手又送回来了。

　　AlphaGo开发者没有在程序中提出围棋常识概念，甚至所有开发者都不是高手（只有第二作者Aja Huang是弈城8d，高手让三四子都可能），很多高深的棋理不明白。但是他们用深度神经网络的办法，隐性地在多层神经网络中实现了很多围棋概念。为什么一个13层的神经网络，几百万节点系数相乘相加，就能预测高手在19*19的棋盘上的行为？通过训练，这些神经网其实已经隐含了很多概念，一层层往下推。所以它下的很像人，确实和人的神经系统类似。

　　机器用多层神经网络识别图片的能力，甚至超过了人。但在围棋上，这其实是一种“掩盖”。人识别图片时是没太多概念的，直接看出结果，机器也这样。但在下棋时，其实不是在识别棋局，还是有明确的建立在“常识”基础上的概念，越是高手概念越多，而且说得清，能教给学生，是一个知识系统。

　　AlphaGo的策略网络和价值网络，那些神经网络各层里，是些什么“概念”没人说得清，也不好控制。DeepMind小组其实也不想去搞清楚，就是暴力堆数据，信奉大数据暴力破解。

　　但围棋是很精微复杂的。某种概念，可能用几百个棋局能说明清楚。但是一大堆概念混在一起，有些概念还没有明确结论，怎么训练？比如前面的“后手眼”概念，人一解释很清楚，DeepMind的人想去改进程序让AlphaGo减少这类失误，就很麻烦。可能要去堆一大堆这类棋局进行训练。先不说能不能找到足够的棋局，在3000万个棋局里，加进一些棋局进行训练会产生什么影响，就很难控制。

　　AlphaGo的策略网络、价值网络、MCTS三大招数确实很强大，但也存在很不好解决的内在矛盾，就是没有概念推理的能力，很简单的都做不到。

　　AlphaGo与人类棋手对局预测

　　假设AlphaGo仍然维持现有的算法框架，但在持续的研究中，增加CPU，增加训练局数，打些小补丁，不断提升能力，那么可以对它的棋力进行推测。

　　这些改进就是让强的越强，但是本质的弱点无法消除。也许可以加一些程序代码，处理连环劫、多劫之类的bug型局面。AlphaGo的策略网络和价值网络已经很好了，对人类有优势或者不吃亏。AlphaGo的MCTS能力对于锁定胜局、抓对手大错误足够了，但还不足以消除自身的错误，增加CPU也不会有本质提高。虽然锁定胜局时，这种死算比人类更靠谱，但对于开放式局面仍然远不够用，这是算法本质的问题。

　　对于大多数业余棋手，AlphaGo只用策略网络和价值网络，连MCTS都不用，就能轻松获胜了。而且下棋速度特别快，只是算神经网络的输出值，0.1秒就可以，对人类等于不花时间。这个版本可以很容易放到手机上。

　　对于强业余五段、六段高手，PC版的AlphaGo可以一战了，需要用上MCTS，但不需要好到48个CPU。

　　对于顶尖业余棋手、冲段少年、等级分不高的二三线职业棋手，AlphaGo会有相当高的获胜概率，48或者1202个CPU只会在概率上有些小差别。当人类棋手在中后盘出小错，或者局部出恶手时，立刻就会输掉，无法翻盘。

　　对于顶尖职业棋手，AlphaGo会有较低的获胜概率。当顶尖职业棋手发挥好时，是可以做到没有明显错着的，甚至有个别方向性大局性的错误也不要紧，只要不是局部恶手被抓住。但是顶尖棋手状态不好或者心理波动的可能性是有的，甚至不小，所以AlphaGo也是有胜机的，甚至在三番五番棋中取得胜利都是可能的。

　　但是如果AlphaGo获胜，职业棋手们的评价会是人类出了明显的错着，而不是机器压倒性的胜利。反过来，人类顶尖高手如果发挥正常，可以对AlphaGo压倒性地全盘压制。

　　三月李世石与AlphaGo的对局，如果李世石输掉，一定是因为他出了恶手。而机器也会被多次发现明显的问题手，因为李世石总有能力在五局中表现人类的高水平。

　　这个情况有点类似于1997年深蓝战胜卡斯帕罗夫。卡斯帕罗夫输了，但当时不少舆论认为是他发挥不佳甚至收钱放水，后来直到2006年都有人类在比赛中战胜了程序。当然后来国际象棋程序越来越强，真正全面碾压人类棋手，甚至可以让人类一个兵或者两先，等级分比人类最强者高几百分。从当时的机器算法框架看，国际象棋程序彻底战胜人类只是个时间问题。

　　围棋的格局会有不同，不会被机器打得这么惨。如果开发者不提出新的算法框架，AlphaGo这样的人工智能程序无法战胜状态良好的人类最高水平棋手，甚至能看出明显的棋力短板。当然由于围棋人工智能不犯大错，抓错的水平很高，对职业棋手群体胜率会比较高，甚至参加世界大赛都有夺冠可能。但职业棋手们仍然掌握着最高水平的围棋技术，这些技术具有真正的艺术性，如果在和人工智能程序的较量中让世界认识到这一点，也有利于提高围棋的影响力。

　　AlphaGo已经取得的成就，无疑是非常了不起、令人震惊的。但通过仔细分析它的算法框架，人类棋手也不需要恐慌，它还达不到人类棋手的最高水平。当然不排除人工智能又搞出另外的高招取得突破，但这不好预测，而且会是非常困难的。

　　分析清楚AlphaGo的强大与不足，有利于破除迷信，“祛魅”。这也引出了更多哲学性的问题，例如：概念是什么？人工智能的极限在哪里？如何把人类积累的智慧和洞察力用到未来的人工智能科研中？

　　稿源：观察者网。作者简介：笔名陈经，香港科技大学计算机科学硕士，中国科学技术大学风云学会研究员，棋力新浪围棋6D。21世纪初开始有独特原创性的经济研究，启发了大批读者。2003年的《经济版图中的发展中国家》预言中国将不断产业升级，挑战发达国家。2006年著有《中国的“官办经济”》。

2016年2月1日星期一

百度地图和支付宝登陆日本

　　据《日本经济新闻》2月1日报道，1月底，“百度地图”的提供地区扩大至日本等4个海外国家。此外，支持“支付宝”的日本店铺数在春节之前达到约200家，翻了一番。针对春节期间的访日中国游客，百度和阿里巴巴纷纷强化服务，吸引客户。百度地图在中国拥有3亿名用户，市场份额达到约70%.目前提供地区包括中国大陆、香港、澳门和台湾，还将涵盖日本、韩国、泰国和新加坡。

　　百度地图计划在1年以内推出导航功能、搜索和预订餐厅、以及派发免税店等优惠券的服务。主要广告收入将来自希望吸引访日游客的企业。支持日本13万个地名搜索。

　　支付宝用户约有4亿人。在春节之前，日本便利店7-11和近铁百货店等将引进支付宝结算。家电连锁店、药妆店、服装店和餐饮店等也将引进。

　　中国的互联网服务大多限于国内。随着中国人海外旅游的增加，中国互联网企业将加强海外服务，扩大业务规模。

　　不过，百度地图的主要竞争对手谷歌地图，则支持几乎所有有人居住的国家和地区。

　　稿源：环球科技