分享

电脑赢了,人输了:初级,沃森

Watson 是 IBM 的一个项目,它的名字来源于该公司富有传奇色彩的第一任总裁,他创造了一台超越人类的超级计算机:下面是如何做到的

电脑赢了,人输了:初级,沃森

问答机

Watson 是 IBM 的一个项目,它的名字来源于公司富有传奇色彩的第一任总裁 Thomas J. Watson。 它的存在确实与游戏有着千丝万缕的联系。 美国一档极受欢迎的电视问答节目:Jeopardy!。

相传 IBM 研究主管查尔斯·利克尔 (Charles Lickel) 一天晚上在一家餐厅用餐时注意到,突然间,在 19 点钟,他的许多客人起身离开了房间。 利克尔对这种奇怪的行为很感兴趣,跟着他们发现他们去了附近的一家咖啡馆。 在这里,他发现他们都聚集在电视机前,专心看着肯詹宁斯忙着在广受欢迎的危险边缘延长他的连胜纪录! Lickel 立即了解到,就共鸣板和受欢迎程度而言,将计算机竞争对手与人类样本进行比较的潜力,以及另一方面,这项工作的复杂性及其研究的内在价值。 这一切都发生在 2004 年秋天。Lickel 后来向公司介绍了他的见解,IBM 的执行研究经理 Paul Horn 采纳了他的建议并将其介绍给他的部门成员。 最后,大卫费鲁奇接受了挑战。 那是 2005 年:Watson 诞生了。

当项目开始时,目标是创建后来被称为“问答机”的东西。 要克服的困难绝非微不足道。 Jeopardy 的结构很简单:主持人(Alex Trebek)提供答案(线索),参赛者必须提出正确的问题。 为了做到这一点,他们必须预订。 谁先于对手,谁就有权做出回应。 答对了就赚到钱(钱越多越难),答错了就赔钱。 问题最多,参与者事先不知道主题。 线索并不总是线性的,它们可以包含首字母缩略词、诗句、双关语。 除了对主题的精通之外,它们还需要机器难以获得的辨别能力。 正如 McAfee 和 Brinjolfsson(第二个机器时代,2014 年)指出的那样,“玩家还必须同时快速、大胆和精确”。

沃森,一个大书呆子

Watson 的早期版本还有一些不足之处。 程序员面临一个重要的选择:选择更谨慎的方法(为了更准确的回答),还是采取更激进的态度(这意味着可以先预订和回答,但也更容易犯错误容易)? 在 2006 年底进行的初始测试中,选择了一种适度激进的行动方案:在 70% 的情况下,Watson 必须首先尝试回答。 然而,开端并不令人鼓舞,汽车的性能远未使其具有竞争力。 事实上,沃森只能正确回答 15% 的问题。 相比之下,在相同条件下,沃森未来的挑战者肯詹宁斯获得了大约 90% 的正确答案。

显然有很多工作要做,但事实证明沃森学得很快。 2010 年,超级计算机终于准备好与人类对手一较高下。 在之前的假设下,Watson 现在能够正确回答 85% 的问题。 出色的表现,但仍然不足以挑战肉体上最好的球员。

为了让这成为可能,我们不得不等到 2011 年初,当时沃森和两个真正强大的对手之间的挑战已经确定:肯詹宁斯和布拉德鲁特。 詹宁斯是历史上连续上垒时间最长的球员,达到了惊人的 74 场。 另一方面,Rutter 是有史以来奖金最高的参赛者,高达 3.400.000 美元,也是 2005 年 Jeopardy 的获胜者! 终极冠军锦标赛(他自己击败了詹宁斯)。 在 14 年 16 月 2011 日至 200 日的三个晚上,Watson 的表现明显优于他的竞争对手。 虽然它无法访问互联网,但电子挑战者确实可以使用 77.147 亿页内容,包括整个维基百科。 尽管如此,IBM 超级计算机的性能并非没有缺陷,尤其是在问题类别包含很少的单词和最少的线索的情况下。 尽管如此,计算机还是没有给人类竞争对手留下任何退路。 最终结果是 Watson 的总奖金为 24.000 美元,而 Jennings 为 21.600 美元,Rutter 为 XNUMX 美元。

游戏结束。 电脑赢了,人输了!

第二天

“首先,我欢迎我们的新主人电脑。” 詹宁斯在最后一场比赛的最后回复中添加了这句话。 承认 Watson 的胜利,引用了《辛普森一家》中的一句话,但或许更重要的是,意识到失败及其影响,以及人类在机器面前的退位。 詹宁斯后来说:«我很喜欢它,并且会立刻再做一次……这与结果无关;这与结果有关。 这是关于成为未来的一部分。” 历史是在那天晚上写成的,这是毋庸置疑的。 正如斯坦福大学教授、人工智能领域的先驱之一爱德华费根鲍姆所指出的那样:“将你的思想倒退 20 年,谁会想到这会成为可能?”。

然而,企业能否成功并非定局。 对于 IBM Watson,它代表了一场赌博。 原本很少有人相信的赌注。 起初,人们对这个项目感到困惑,或者更糟的是,漠不关心。 Paul Horn 甚至在他自己的团队中也不得不面对这样一种怀疑:«最初他们说不,这是一个荒谬的项目,它太黑了,这不是真正的 IT 测试,我们可能无法无论如何都要去做。”

起步缓慢,困难和不信任齐头并进。 Horn 再次回忆道:“当我在 2007 年底离开 IBM 时,Watson 还是一个萌芽项目……它有来自 Charles Lickel 所在地区的三个人,他们从旧的 Jeopardy 程序中获得了数据,并开始训练机器。 当时他连一个五岁的孩子都打不过。 预测是“天知道打败一个成年人需要多长时间,更不用说冠军了”»。

但最终沃森做到了。 几年后,IBM 的研究主管和沃森的教父之一约翰·凯利在接受查理·罗斯采访时透露了围绕那些时刻的忧虑:“实际上,在“危险边缘”游戏中! 五年前,当我们把那个计算机系统放到电视上时,我们就放弃了。 而且我经常觉得我把我的孩子放在校车上,我无法控制它。” 一个现在必须证明他知道如何用自己的腿走路并完全依靠自己的能力的男孩。 凯利继续说:“她不知道她会被问到什么问题。 它是完全自主的。 我不能再碰他了。”

推理模型

沃森的成功引起了相当大的关注。 它使 IBM 重新成为人们关注的焦点,尽管如此,它还是一次成功的商业运作。 这一事件留下了惊讶、困惑,以及当一个人进入未知世界时总是会发生的恐惧。 “人们问我这是不是 HAL [9000 年太空漫游中的 HAL2001],”Ferrucci 观察到,“这只是科幻小说……我们离那个点还很远。”

那么是什么让 Watson 与其他计算器区分开来呢? IBM 超级计算机是如何战胜它的人类挑战者的?

Ferrucci 继续说道:«...... HAL 不是重点。 重点是“星际迷航”计算机,通过智能对话寻找信息,可以提出进一步的问题,计算机能够考虑所有证据并寻求进一步的问题。 正是这种解释人类语言的复杂性、把握其方面、微妙之处和细微差别的能力,正是 Watson 的独特之处,并将其与前身 Deep Blue 区分开来。 Ferrucci 指出,«当你想到国际象棋时,你可以将它们分配给定义明确的数学问题的上下文。 棋盘上的每一块棋子、每条规则、每一步都被完美定义。 这是明确的。 对于问题的真正性质及其运作方式,没有解释或不确定的余地。 深蓝当然需要一台足够强大的计算机来提前研究足够多的棋步,从而能够找出赢得比赛的最佳棋步。 但没有任何歧义或外部背景或不确定性需要解释。 这个问题是有限制和明确定义的。 人类语言完全是另一回事。 为了准确回答问题,必须更恰当地理解充满歧义和细微差别的语言”。

事实上,这种品质使 Watson 更接近 AlphaGo,它还具有另一个属性:它是一台能够学习的机器。 约翰·凯利这样描述他的智慧:“所以他一开始就没有内在的智慧。 他基本上是个孩子。 但是一给它数据,给它结果,它就开始学习,这和过去所有的计算系统完全不同,它实际上什么也学不到。 当它与人类互动时,它会变得更加聪明。 永远不要忘记。”

恰恰是这种特权给了 IBM 超级计算机第二次机会,事实上它允许公司在商业上利用它的品质。 最终,与发生在深蓝身上的事情不同,它给了沃森第二次生命。 今天成功延续的第二人生。

但那是另一个故事了……

评论