分享

IBM Project Debater,懂得应对辩论的机器人诞生

以色列的 IBM 团队推出了第一个能够与人类讨论复杂话题的人工智能系统——在最近几个月的前两次公开比较中,IBM 机器展示了其所有令人印象深刻的能力,即使它揭示了同理心的局限性

IBM Project Debater,懂得应对辩论的机器人诞生

那是 2012 年:Project Debater 诞生

七年后,Watson 击败了 Jeopardy! 游戏中有血有肉的冠军,令人惊叹不已,IBM 再次尝试通过展示其新生物:IBM Project Debater 来让人惊叹。

在 2011 年取得巨大成功后,蓝色巨人是时候成立一家新企业了。 “数千名研究人员中的每个人……都收到了同一封电子邮件,询问他们 IBM 研究院的下一个重大 AI 挑战应该是什么,”位于海法(以色列)的 IBM 研究中心成员 Noam Slonim 回忆道。 没有确切的规格,但是新项目应该满足某些特征,最重要的是“……科学上有趣和刺激,并且应该具有一定的商业价值。 一些大的东西,一些会有所作为的东西。” 正是斯洛尼姆本人提出了追求创造和训练能够与人类对手进行有意义辩论的人工智能的目标。 起初,只是一个普通的建议,最终在一年后赢得了其他竞争提案的支持,并成为 IBM Research 决定关注的新挑战。

该项目是 IBM 团队在以色列海法实验室协调下进行六年工作的成果,旨在开发一种能够与人类完全互动的人工智能。 但是,“什么是 Project Debater?” 这个问题是由蓝色巨人本身提出的,它也提供了答案:«一个将人工智能带入辩论艺术的系统»。 从本质上讲,正如该公司谨慎指出的那样,“Project Debater 是第一个能够与人类讨论复杂话题的人工智能系统”。

事实

去年六月在旧金山的 Watson West 是人类专家与 IBM 最新发明的两场不寻常辩论的场所。 所选择的比较方案给演讲者分配了总共十分钟的时间,按照这个顺序:四分钟介绍自己的论点,四分钟回答和反驳对手的论点,两分钟作结论性陈述。

第一个矛盾的讨论主题是:“我们应该资助太空探索吗?”。 反对 2016 年以色列辩论冠军诺亚·奥瓦迪亚 (Noa Ovadia),支持机器。

Project Debater 论证了他的论文,认为支持太空探索有助于推进科学,打开新一代的思想并成为他们灵感的源泉:“......它激励我们的孩子追求科学、技术和数学方面的培训和职业”。 他甚至添加了一个向美国的宏伟致敬的符号:“......拥有太空探索计划是成为大国的基本要素。” 他有没有试图吸引在场的观众?

然而,根据诺亚·奥瓦迪亚 (Noa Ovadia) 的说法,这些资金可能会用于地球上的其他研究领域。 该机器的复制品避免了正面碰撞,并专注于这样一个事实,即太空探索投资的影响,从中获得的理想技术和经济利益,将大于所产生的成本:«这很容易要说有些事情最重要的地方可以投资,我对此没有异议。 没有人声称这是我们购物清单上的唯一商品。 但这不是重点。 由于补贴太空探索肯定会造福于社会,我认为这是政府应该追求的事情。”

第二场辩论让 IBM 的 AI 与另一位以色列专家 Dan Zafir 进行了辩论,主题是:“我们应该增加远程医疗的使用吗?”。 在这两次讨论中,辩论者都展示了他的“准备”和他所借鉴的广泛资源,引述范围从“......来自阿拉伯联合酋长国的酋长,到太空探索将产生的就业数量 - 根据给德国经济事务部长。

在他的回答结束时,机器人引用了一个笑话:“我是技术力量的真正支持者……它应该是这样的”。 他这样做是为了掩饰难以回应他的对话者的言论,正如迪特尔博恩所建议的那样,还是为了讨好听众,这很难确定。 然而,机器的讽刺不是无意的,也不是偶然或错误的,而是 IBM 技术人员工作的结果。 事实上,有几次 AI 冒险开玩笑或开玩笑,有时成功,有时不那么成功。

判决

值得注意的是,辩手“……除了简短的介绍”,之前没有接受过任何指示,也没有遵循任何预先准备好的剧本。 IBM 研究主管 Ed Arvind Krishna 热衷于强调这一点:«对于这项新技术的首次演示,我们从选定的主题列表中进行了选择,以确保进行有意义的讨论。 然而,Project Debater 从未接受过有关主题的培训»。 辩论的主题实际上是从一个由大约一百个主题组成的列表中选择的,IBM 认为,基于存储在其内存中的数据,人工智能能够将自己与人类进行比较。 Noam Slonim,“……估计技术可以在 100% 的时间内就这 40 个主题进行“有意义的”辩论”。

Project Debater 能够依赖的信息量是巨大的。 它包括数亿个最不同类型的文档:从维基百科页面到文章和论文,以及音频和视频材料,«...... 300 亿篇文章、新闻和学术作品的集合,以前为快速索引而编入索引搜索”。 由 IBM 工程师编入索引并经过严格审查。

在两项比较结束时,记者和分析人士的听众被要求根据两个基本类别评出获胜者:论点的陈述和竞争者带来的知识丰富。 总而言之,即兴“陪审团”承认 IBM 生物已经证明拥有所提出问题的相关知识要素,尽管有血有肉的反对者在阐述方面更胜一筹。 虽然在第一场辩论中胜利属于人类,但在第二场辩论中人工智能被认为更具说服力。 如果诺亚·奥瓦迪亚 (Noa Ovadia) 设法让两名观众站在她这一边,那么九个人承认由于项目辩论者提供的论据而改变了他们对使用远程医疗的看法。 虽然,正如卫报所指出的那样,“......房间里有很多 IBM 员工,他们可能一直在为自己的创造加油”,但这一次我们没有看到人工智能的压倒性胜利,但我们可以说是平手. 一条与我们人类更亲近的领带。

XNUMX 月在以色列在记者观众面前举办的第二次展览证明了这一点。 IBM 机器与两位以色列辩论专家 Yaar Bach 和 Hayah Goldlist Eichler 进行了较量,显得不那么出色。 解决的问题分别是:大规模监控和基因工程。 与之前在旧金山组织的活动一样,IBM 自动机能够在信息和知识方面战胜对手。 然而,在提出他的论点以及在阐述的重点方面,他又一次没有达到那个人的水平。 总而言之,“系统和巴赫打成平局,但在第二轮中,胜利属于 Goldlist Eichler,尽管在该主题的知识得分较低,但他设法改变了更多观众的想法”。

第二天

“想一想。 人工智能系统与人类专家进行辩论,倾听她的论点,并用自己的即兴推理令人信服地回应,以说服听众考虑其在有争议话题上的立场。 Arvind Krishna 突然将我们投射到另一个维度,直到现在,这个维度还是科幻电影或纪录片的猎场,讲述一个或多或少的未来。 D'emblée,即使机器显示出所有的不确定性和缺点,这样的未来已经部分成为现实。 事实上,除了技术狂热者之外,有多少人会瞄准或只相信人工智能在短期内可能有类似的表现? 尽管强调了局限性,但 AI 的显示实际上令人惊讶。 邓迪大学教授克里斯·里德 (Chris Reed) 评论道,这是一项“非凡的技术”。

Ovadia 本人对此印象深刻:“我很惊讶......技术在能够同时执行多少正确的人类认知能力方面确实令人不安”。 以色列冠军有机会与 IBM 自动机竞争几个月,目的是最终确定系统:«起初我很惊讶,不仅是简单的语言,还有论证的构造......能够倾听,然后对我所说的话做出有意义的回应。

恰恰是 Ovadia 所指出的奇特“品质”是使 Project Debater 成为“非常特殊的技术......人工智能技术发展的重要里程碑”的主要特征之一,正如首席执行官和国家/地区的 Daniel Melka 所说IBM 以色列经理。 从本质上讲,Debater 的原创性基于三项创新技能,“……三项关键技能,每一项都开辟了 AI 领域的新视野”。

1)首先根据可用数据编写和阐述演讲。 “第一个冒险是创造一台能够产生意见的计算机——类似于报纸社论——建立在数据的基础上,并用完整的句子表达出来”。

2)其次,倾听对话者的回答,以识别和推断最重要的概念。 “第二种能力允许机器人听到并理解其对手,使其能够识别隐藏在长而连续的口头语言中的关键语句。”

3) 最后,创建一个单一的知识图谱,与人类表达的疑问相关,以允许“道德”推理。 “第三项壮举是让计算机能够简洁地、有原则地表达人类的困境。”

然而,辩手的表现并非没有缺陷。 除了用不同的词多次重复同一个概念外,有一次,在关于太空探索的辩论中,他认为这“……比 [拥有] 好的道路或更好的学校或高中医疗保健更重要” . 一个不能真正分享的论点……

除了一些语言上的不确定性之外,在某些情况下,我们的印象是句子的构造并不完全“自然”:有时话语的初始部分后面没有出现看起来流畅的第二部分; 有时,轶事和引语似乎几乎是随意的。 有一次,在一个句子的中间,一个“画外音”插入显示机器已经进入了一段视频记录。

尽管如此,IBM 的新“mirabilia”仍然保持着自己的地位。 正如克里斯·里德 (Chris Reed) 指出的那样,我们目睹了一种表现,这种进步绝非微不足道:«这确实是向前迈出的重要一步……我认为令我印象深刻的是人工智能技术的结合。 参加辩论之类的活动并不是成败攸关的事情。 ......你必须能够解决很多问题,然后将所有这些问题整合到一个工程解决方案中。

结论

机器表现出缺乏同理心,揭示了当前人工智能领域研究的局限性,并为关于人工智能的未来和功能的讨论提供了致命的进一步材料。 此外,尽管许多声明都强调赞扬人与机器之间日益密切的合作,但我们被告知,人工智能扮演着非常重要的辅助角色,竞争的幽灵正在霸道地重新出现。 人将在这一切中扮演什么角色,扮演什么角色? 它是否能够保持它的“效用”,它会保持它自己的存在空间,在一个似乎一天比一天小的周界内保持一种奇特的独特性,还是会成为一个边缘元素,甚至是多余的?

最后,仔细观察,Project Debater 也揭示了它自己的阴暗面……

IBM 设想了 Project Debater 未来的顾问角色。 “我们相信,能够理解我们人类的人工智能具有巨大的积极潜力,”克里希纳说。 咨询师没有偏见,没有情绪,因此不受情绪和环境的影响,能够对特定主题提供客观的看法。 “这可以提高基于证据的决策水平,”克里斯·里德 (Chris Reed) 指出。

一种工具甚至能够同时提供决策中固有的利弊。 “随着时间的推移,在与该应用程序兼容的业务环境中,我们将越来越多地转向使用该 AI 系统来促进推理、解决尚未解决的问题”,他热衷于重申 IBM。

当然,它多次强调机器的作用不是做决定(代替人),而是促进讨论,​​“……在谈判桌上充当另一个声音”。 根据 Big Blue 的说法,Project Debater 的功能“将是‘促进者’,使思想、观点、观点和反思更好地流通,以达到有效和高效的综合……‘思想家’为有血有肉的思想家骨子服务”。

令人振奋,甚至令人安心的前景。 但是让我们想象一下,另一个维度。 一个反乌托邦的未来,与不可阻挡的技术进步的叙述向我们承诺的“宏伟而进步的财富”截然不同且遥远。 让我们想象一个充斥着数据、充斥着新闻和令人困惑的信息的世界。 假新闻充斥和困扰的信息……

如果使用 Project Debater 等工具的品质而不是为新闻带来秩序和整理信息的混乱,实际上是为了增加这种混乱,以及将意见导向一个方向而不是另一个方向? 如果它不是用来识别和披露假新闻,而是用来制造新新闻,充斥网络,而且不仅是用虚假或歪曲的新闻,用可能的来代替真实的,那会怎么样? 有可能吗? 可以推测,它甚至不需要付出很大的努力,尤其是在社交媒体的世界里,传播和新闻不一定需要特别精致或清晰。

这样的工具可以成为一种“点菜式”思想家。 更糟糕的是,一个 Think Thank,因为有很多但自动化的,能够连续不断地提出建议和“安排”,影响、指导、说服。 一种能够以裁缝般的精确度组装事实和元素的工具,能够以人类无法想象的速度加入和分离。 一个远离我们的现实,过于反乌托邦? 或许 …

评论