王小川谈人机大战:重演了一部进化史,重新认识智慧的边界

来源:www.xjctc.net   时间: 2020-01-22

摘要:如果有合适的条件,可能存在其他生命进化路径和更多不同的进化结果。

第二套AlphaGo的三场比赛昨天开始了。最终柯杰输给了Alpha Go,第二盘被淘汰出局。目前的得分是0: 2.

然后,搜狗公司首席执行官王小川发表了一篇评论,称2017年人机战争的重要性在于它重现了一个进化史,重新理解了智慧的界限。王小川说:“AlphaGo2.0告诉我们,如果有合适的条件,可能还有其他的生命进化路径和更多不同的进化结果。”

王小川认为AlphaGo 2.0与1.0非常不同。新算法在计算资源上的开销很小。当前游戏输入神经网络,电流流动。输出是最好的国际象棋解决方案。王小川猜测,只有一个GPU可以工作,每次动作消耗的能量都接近人脑。

在王小川看来,AlphaGo2.0完全抛弃了人类在过去两千年中演变的围棋游戏体验,并找到了另一条道路。只有通过学习和发展这两台机器,它才能赶上人类进化的速度。它还开发了一种完全不同的下棋方法,更接近完美状态,实现了人类的压榨,重现了Go的进化历史,以及与两千年不同的进化结果。

附在王小川的全文上:

它终于来了。

AlphaGo一年前发布。读完报纸后,我被告知该机器将赢得人类。很多业内朋友都不相信。出于这个原因,我收到了很多“智力税”。之后,微信红包被送到春节。此外,我还做了两个断言:一个是谷歌很可能再次开发AlphaGo 2.0,摆脱“监督学习”,不再需要人类来播放Go的历史数据,而只能通过“增强学习”,两个AlphaGo自我学习如何下棋并达到顶峰。从公开信息来看,这种说法处于中间位置。这是什么意思,它是什么意思?

显着的技术进步:与1.0原则大不相同,更贴近人们

AlphaGo 1.0是三种算法的巧妙结合:蒙特卡罗树搜索+监督学习+增强学习。蒙特卡洛树搜索是一种优化的暴力计算,比1997年的深蓝暴力计算更聪明。这里的监督学习是通过学习3000万人类象棋模式来模仿具有六个以上阶段的职业棋手的规则。它也是AlphaGo取得突破性进展的关键算法。作为强化学习的辅助手段,两个AlphaGo学习如何从自我竞争中下棋,据报道国际象棋的改进是有限的。

根据公开信息,这个AlphaGo2.0的技术原理与前一个非常不同:

1.放弃监督学习,并没有使用3000万游戏分数进行训练。这是AlphaGo最引人注目的算法,也是当今主流机器学习不可避免的核心条件:依靠高质量的数据,它再次突破了这一特定问题。

2.放弃了蒙特卡罗树搜索,不再进行暴力计算。从理论上讲,算法越愚蠢,就需要添加更多的暴力计算。算法越聪明,计算就越不那么暴力。从AlphaGo 2.0的“背心”大师的历史行为来看,游戏速度非常快,大约每10秒一步,所以速度很可能会放弃暴力的计算。

3.大力加强学习的作用,在鼓的算法之前,正式成为主力军。想想多么鼓舞人心:两个白痴机器,遵守步行和获胜的规则,从日夜开始随意散步,总结经验,不断批评和自我批评,并成为一周内的大武器。

在这样的算法下,AlphaGo 2.0具有最小的计算资源开销,并且当前游戏被输入到神经网络中,并且当前流动,并且输出是最佳的国际象棋解决方案。我想在这个算法下,可以依靠只有一个GPU来工作,每一步消耗的能量都接近人脑。

最重要的一点:AlphaGo2.0国际象棋风格完全脱离了人类的经验

今年年初,AlphaGo成为60名球员的连胜纪录。在Go领域,机器的胜利已成为公认的结论。这导致许多人开始问:这种人机战争是否仍然有意义?我们关心的不再是机器是否会赢 - 而是机器将用来击败人类的位置。

AlphaGo在人类象棋中学到了3000万步,而国际象棋的风格与人类相似。在游戏现场,偶尔的AlphaGo移动和人们的经验不一致,它被评为“愚蠢”,但在中盘后,人们发现机器逐渐占据主导地位并最终获胜,以便被解释为“AlphaGo中盘逆转”,之前就是两场比赛的情况。在第三场比赛中,评论者开始上课,并开始将AlphaGo视为具有赞赏和敬畏感的“老师”。这对国际象棋世界带来了巨大影响。大家之前认为正确的事实上是不正确的。

柯杰曾评论说:“AlphaGo出现后,很多理论都被推翻了,然后以前的公式变得好笑,而失去这么多眼睛的不再是两点。”人类总结了经历了数千年实战的理论,然后计算机告诉人类:这些都是错误的。现在在许多比赛中,人类国际象棋选手已经开始从机器中学习,模仿AlphaGo的方法。国际象棋聂卫平也表示“理论已被颠覆。”

而AlphaGo2.0则是出于人类模仿的机器,国际象棋的风格也将完全脱离人类的刻板印象。在与柯杰的比赛中,我们将继续发挥我们意想不到的动作,这些动作将被视为低级错误或完全不合理的教科书,但没有普通的玩家会这样玩,但是一个新手会被拨打错误的时候他们这样玩。

AlphaGo2.0将继续创造这样的局面,他仍然是对的。我可以想一想这位职业棋手的心理会受到多大的震惊:你不仅曾想过在你的生活中像这样下棋,而且整个国际象棋世界从未想过它。你怀疑你还活着吗?你会反思两岁的Go的发展吗?为什么会出现这样的瓶颈?有多少海洋在等我们去探索?等不及我们去探索,电脑给出了最终的答案。什么尴尬。

我们将讨论它,AlphaGo是什么。但它可以这样推理:体裁和风格有局限性。只有当所有类型都看不到这种类型时才能达到高水平。 AlphaGo 2.0将是这样一台机器,没有风格,坚如磐石。

我可以想象这个与柯杰的比赛,这可以经常显示“奇怪的技巧”并完全颠覆人类对围棋的理解 - 这将是游戏的最大吸引力。英雄克杰,解锁108个姿势抵抗。

2017年人机战争的意义:重演进化史,重新认识智慧的边界

在2016年AlphaGo和李世石的比赛之后,人工智能进入了公众的视野,我们开始重新思考机器与人之间的关系。

Go已有2000多年的历史。在漫长的思考中,Go理论已经发展并达到了高标准。 AlphaGo赢了,我们可以把它解释为“绿色的蓝色”。毕竟,它是人类围棋的主要演变。这条路再次攀升。

AlphaGo2.0完全放弃了人类两千年的进化Go体验,并找到了另一条道路。它只能在两台机器中学习和进化。它不仅赶上人类进化的速度,而且还开发了一套基本的不同的下棋方式,更接近完美,实现了对人类的压榨,重新演绎了Go的进化历史,并得出了不同的进化结果从两千年开始。

这会给我们带来什么?如果你跳出Go的规则,那么类比就会看到地球上生命的演变:人类逐渐从原始的有机物质演变为单个细胞到灵长类动物,并发展智慧超越所有其他生物。这条路是独特的吗?人类生命形式和顶级生活形式有多远? AlphaGo告诉我们,我们仍然有很大的发展空间,而AlphaGo2.0告诉我们,如果有合适的条件,那么完全有可能存在其他生命进化路径,以及更多不同的进化结果。

让我们欢呼人们的智慧来创造AlphaGo,这也帮助我们睁开眼睛,看到我们仍然远离最终的生命形式和智慧。

保持敬畏,坚定,并取得成功。

  • 友情链接:
  • 版权所有© 新疆计算机培训中心 | 新ICP备10201303号-1 | www.xjctc.net . All Rights Reserved | 网站地图