机器超越人：从深蓝到阿尔法围棋的算法挑战

自深蓝与世界冠军加里卡斯帕罗夫的国际象棋比赛以来，人工智能已经挑战人类二十年，但在 2016 年超车成为现实：Deep Mind 算法击败围棋世界冠军，这一次没有争议

时间是1996年，一则新闻迅速传遍全球，引起轰动和赞叹：计算机第一次在棋盘上战胜了世界冠军。 10 年 1996 月 XNUMX 日，IBM 专门为国际象棋设计和制造的计算机“深蓝”(Deep Blue) 击败了冠军得主加里·卡斯帕罗夫 (Garry Kasparov)， 在人计算器挑战赛的首场比赛中。这是一个历史性的日子，人工智能实现了一个被大多数人认为遥不可及、不可能达到、机器无法实现的目标。虽然IBM超级计算机在第一局中战胜了卡斯帕罗夫，但最终交锋的结果还是俄罗斯冠军获胜。在随后的比赛中，深蓝无法重蹈覆辙，最终卡斯帕罗夫三胜两平。人以 4-2 击败汽车。

许多人松了一口气，人类保留了它的首要地位。计算机对人类的危害可能不再是科幻小说的专属主题，但至少它还在未来。没有错！次年，两位竞争者展开报复，这次深蓝获胜。因此在 1997 年 3,5 月计算机击败了人：2,5-XNUMX。一个极限被跨越，一堵墙被打破。

加里·卡斯帕罗夫 (Garry Kasparov) 在最近出版的一本 300 页的书“深度思考：人工智能的终结和人类创造力的开始”中重建了这个丢失的挑战。

然而，该事件并非没有争议。首先，Deep Blue 并不位于进行比赛的房间内，而是在几公里之外，因此，数据不是直接从计算机发送的。这一事实和其他因素导致卡斯帕罗夫声称深蓝在比赛中得到了帮助。根据先前的协议，在挑战期间多次返回的元素以及 IBM 拒绝 Kasparov 提供有关机器活动的打印输出的请求，只会加强疑虑并加剧怀疑。败者最后要求重赛，IBM 断然拒绝，最终退出深蓝。

20 年后出现了 Deep Mind 算法

在 2003 年的纪录片《游戏结束：卡斯帕罗夫和机器》中，采访了一些为超级计算机的胜利蒙上阴影的目击者。从这些可以看出，最终，深蓝代表了 IBM 为增加其股票在股票市场上的价值而实施的一种策略。在战胜卡斯帕罗夫的那一天，IBM 股价上涨了 15%。

因此，具体来说，机器的胜利可能比最初让人相信的要人性化得多。或者如 Nate Silver 所说，是偶然的结果。在他的书（信号和噪音。预测的艺术和科学）中，他将深蓝的成功归因于机器做出的绝对非理性的举动，这是偶然的结果。此举将无可挽回地动摇卡斯帕罗夫的人性，削弱他的信任和理性。

二十年后，AlphaGo 打破了另一个极限。 Deep Mind 算法在 2016 年头几个月败北，这次没有争议也没有招数，先是欧洲冠军，然后是世界围棋冠军。胜利是明确而明确的。这台机器确实有能力超越人类，这一事实证明了这一点：在 29 年 2016 月 4 日至 2017 年 XNUMX 月 XNUMX 日的一周内，AlphaGo 伪装成连续 XNUMX 场战胜了地球上最好的棋手肉。

计算容量：10170

直到最近，人们还认为某些特定区域仍将是人类的专属领域，或者在最坏的情况下，将在未来很长一段时间内保持这种状态。其中既有国际象棋，也有围棋，这两种游戏虽然规则简陋，动作看似简单，但其实隐藏着很高的难度。难度由移动组合的数量和可能的游戏配置决定。如此之大的数字使人相信没有计算机能够掌握如此复杂的事物。因此，普遍认为国际象棋，甚至围棋，仍将是人类智慧的特权，尤其是直觉。更不用说会突然投降了。

但是，如果深蓝凭借强大的计算能力（每秒能够计算 220 亿步）通过蛮力获胜，那么对于 AlphaGo 来说，情况就不同了。围棋的组合数量比国际象棋多得多。对于每一步，平均而言，机会是十倍。仅凭计算能力，尽管巨大，但不足以考虑大约 10170 种不同的情况，同时正确判断游戏所带来的陷阱。

那么AlphaGo是如何战胜世界冠军的呢？很简单，学习了。

深度学习，机器的秘密武器

正如 Deep Mind 的创始人 Demis Hassabis 所说，有两种方法可以让计算机变得更聪明。第一种方法提供对给定问题的确定解决方案进行编程并让机器执行它。第二，这就是 AlphaGo 的情况，在于 «...... 赋予计算机从自身学习，从经验中学习的能力。 ......我会教你如何学习，我不会给你解决方案»。

AlphaGo 成功的秘诀就是深度学习。 “该算法具有三个特征，全部来自神经生物学：强化学习、卷积神经网络和选择性记忆循环。”

将 AlphaGo 与深蓝区分开来的另一个特点在于，Deep Mind 生物并不是专门为围棋创建的。事实证明，随着时间的推移，底层算法能够学习和适应不同类型的游戏。它的进步和收购，其实并不是精心策划的结果，而是历练的结果。它所知道的，AlphaGo 已经通过对弈以完全自主的方式发现和吸收了。 “新一代算法的标志是，就像人一样，他们从成功和失败中学习。”

在多达 49 种不同的 Atari 2600 游戏中训练，Deep Mind 的算法不仅超越了其他竞争算法，也超越了人类。 “......在其中的 29 场比赛中，算法的得分超过人类专业测试员 75% 或更多，有时甚至以非常大的优势击败他们。”

认知计算

AlphaGo 证明我们现在正在进入 IBM 所描述的数据处理的第三个时代：认知计算时代。第一个时代，即制表计算时代，从一开始到 50 年代，计算机能够执行基本的数学运算，使用穿孔卡进行输入和输出。第二个时代，Programming Computing 时代，从 50 年代至今，是电子计算机时代。机器也能够处理命令 (if/then) 和逻辑结构，但必须按照特定规则指示它们执行此操作，因此需要对其进行编程。

认知计算，Jonas Nwuke (IBM) 解释说，“……它的诞生是为了打破“如果/那么”逻辑中固有的僵化……认知计算是一种概率阐述，其结果在一定范围内变化，而不是严格地“是或不，对或错”»。

IBM 对认知计算的重视至少在某种程度上是出于自身利益，它是对战胜卡斯帕罗夫不满意的强大营销机器的齿轮之一。事实上，AlphaGo 有一个前任，或者，如果你愿意的话，深蓝有一个继任者。打破又一道障碍的超级计算机夺走了人类的另一个狩猎储备，剥夺了他进一步的确定性：一句话，华生。

我们将在下一篇文章中处理 Watson