シェア

ディベートに対処する方法を知っているロボット、IBM Project Debater が誕生

イスラエルの IBM チームは、人間と複雑なトピックについて話し合うことができる最初の人工知能システムを立ち上げます。ここ数か月で、IBM マシンが共感の限界を明らかにしたとしても、その印象的な能力をすべて実証した最初の XNUMX つの公開比較が行われました。

ディベートに対処する方法を知っているロボット、IBM Project Debater が誕生

2012年:Project Debater誕生

ワトソンのパフォーマンスから XNUMX 年後、ゲーム Jeopardy! の生身のチャンピオンを打ち負かして驚かせることができた IBM は、新しい生き物である IBM Project Debater を提示して、再び驚かせようとします。

2011 年の輝かしい成功の後、Big Blue は新しい事業を立ち上げる時が来ました。 イスラエルのハイファにある IBM リサーチ センターのメンバーである Noam Slonim は、次のように回想しています。 正確な仕様はありませんでしたが、新しいプロジェクトは特定の特性を満たしている必要があり、何よりも「… 科学的に興味深く刺激的であり、商業的価値があるはずです. 大きな何か、違いを生む何か。」 人間の相手と意味のある議論ができる人工知能を作成してトレーニングするという目標を追求することを提案したのは、スロニム自身でした。 最初は普通の提案でしたが、XNUMX 年後には競合する他の提案を打ち負かし、IBM Research が焦点を当てることを決定した新しい課題となりました。

このプロジェクトは、イスラエルのハイファ研究所によって調整された IBM チームによる XNUMX 年間の作業の結果であり、人間と完全に対話できる AI の開発を目指しています。 でも、「Project Debaterって何?」 質問は Big Blue 自身によって行われ、「人工知能を議論の芸術に持ち込むシステム」という答えも提供されます。 要するに、同社が慎重に指摘しているように、「Project Debater は、人間と複雑なトピックについて話し合うことができる最初の人工知能システムです」.

事実

昨年 XNUMX 月、サンフランシスコのワトソン ウェストでは、人間の専門家と IBM が生み出した最新の驚異との間で XNUMX つの異例の討論が行われました。 選択された比較スキームでは、次の順序に従って合計 XNUMX 分間がスピーカーに割り当てられました。XNUMX 分間は自分自身のテーゼを提示し、XNUMX 分間は反対者のテーゼに返信して反論し、XNUMX 分間は結論を述べます。

最初の矛盾の議論の主題は、「宇宙探査に補助金を出すべきか?」でした。 2016 年のイスラエルのディベート チャンピオンである Noa Ovadia に対して、マシンを支持して。

プロジェクト討論者は、宇宙探査を支援することは科学の進歩に役立ち、新しい世代の心を開き、彼らのインスピレーションの源になると主張する彼の論文を主張しました。 彼は、米国の壮大さにうなずくような表記を追加しました。 彼は出席している聴衆を魅了しようとしましたか?

しかし、ノア・オバディアによれば、資金は地球上の他の研究分野に向けられる可能性があるという。 マシンのレプリカは正面衝突を回避し、宇宙探査への投資の影響、そこから得られる望ましい技術的および経済的利益が、発生したコストよりも大きいという事実に焦点を当てました。お金を投資する最も重要な場所があると言うことに、私は異議を唱えません。 これが私たちの買い物リストの唯一のアイテムであると主張する人は誰もいません. しかし、これはポイントではありません。 宇宙探査への補助金は確実に社会に利益をもたらすので、政府が追求すべきことだと思います。」

XNUMX 番目の討論では、「遠隔医療の使用を増やすべきか?」というトピックについて、IBM の AI が、別のイスラエルの専門家であるダン ザフィールと対戦しました。 両方の議論で、討論者は彼の「準備」と彼が利用する情報源の広大さを披露し、「...アラブ首長国連邦の首長から、宇宙探査が生み出したであろう仕事の数に至るまで、ドイツの経済大臣によると。

彼の返事の最後で、自動人形はジョークに頼っていました:「私は技術の力の真の支持者です...そうあるべきです」. ディーター・ボーンが示唆したように、彼が対話者の発言への対応の難しさを隠すためにそれを行ったのか、それとも聴衆に気に入られようとしていたのかは、立証するのが難しい. しかし、マシンの皮肉は、不本意ではなく、偶然やミスによるものでもなく、IBM 技術者の仕事の結果です。 実際、AI は何度かジョークやジョークに挑戦してきましたが、成功したこともあれば、それほど成功しなかったこともあります。

評決

討論者は、「...簡単な紹介は別として」、事前に指示されておらず、事前に準備された台本にも従わなかったことに注意することが重要です。 IBM の研究責任者である Ed Arvind Krishna 氏は、次のように強調しています。 しかし、Project Debater はトピックについて訓練されたことはありません». 討論の主題は、実際には約100のトピックからなるリストから選ばれました.IBMは、メモリに保存されたデータに基づいて、AIが人間に対して自分自身を測定できると信じています. Noam Slonim 氏は、「…テクノロジーは、これら 40 のトピックに関する「有意義な」議論を XNUMX% の確率で維持できると見積もっています」.

プロジェクト討論者が信頼できる情報量は膨大です。 これには、ウィキペディアのページから記事やエッセイ、オーディオやビデオの資料まで、さまざまな種類の数億のドキュメントが含まれています。検索"。 IBM エンジニアによって索引付けされ、厳密に吟味されています。

XNUMX つの比較の最後に、ジャーナリストとアナリストの聴衆は、XNUMX つの基本的なカテゴリに基づいて勝者を決定するよう求められました。議論の提示と、競合者によってもたらされた知識の充実です。 要約すると、即興の「陪審員」は、生身の敵対者が説明において優れていたにもかかわらず、IBMクリーチャーが提起された問題について関連する知識の要素を持っていることを示したことを認識しました. 最初の討論では人間が勝利したが、XNUMX 番目の討論では AI の方が説得力があると見なされた。 ノア・オヴァディアが XNUMX 人の観客を味方につけることができた場合、XNUMX 人が、プロジェクト討論者によって提供された議論のおかげで、遠隔医療の使用についての意見が変わったことを認めました。 ガーディアンが指摘したように、「…部屋には多くのIBMスタッフがいて、彼らは自分たちの創造を応援していた可能性があります」とはいえ、今回はAIの圧倒的な勝利を目撃していませんが、タイについて話すことはできます. 私たち人間にとっても身近なネクタイ。

そして、XNUMX月にイスラエルでジャーナリストの聴衆の前で開催されたXNUMX回目の展示会は、それを証明しました. IBM マシンは、XNUMX 人のイスラエルの討論の専門家である Yaar Bach と Hayah Goldlist Eichler と対戦しましたが、それほど優秀ではないように見えました。 取り上げられた問題は、それぞれ、集団監視と遺伝子工学でした。 サンフランシスコで開催された前回のイベントと同様に、IBM オートマトンは情報と知識の面で敵を実際に打ち負かすことができました。 しかし、やはり、彼は自分の議論を進める点で、いわば説明を強調する点で、その男には及ばなかった。 結論として、「システムとバッハは引き分けましたが、第 XNUMX ラウンドではゴールドリスト アイヒラーが勝利を収めました。ゴールドリスト アイヒラーは、主題に関する知識が低いにもかかわらず、聴衆のより多くの人々の心を変えることができました」.

翌日

「ちょっと考えてみて。 AI システムは人間の専門家と討論に参加し、彼女の議論に耳を傾け、論争の的となっているトピックに対する自身の立場を検討するよう聴衆を説得するために、説得力のある独自のスクリプト化されていない推論で応答しました。 Arvind Krishna は突然、私たちを別の次元へと投影します。それは今まで、もっともらしい、多かれ少なかれ未来についての SF 映画やドキュメンタリーの狩猟場でした。 D'emblée、機械によって示されたすべての不確実性と欠点にもかかわらず、そのような未来は部分的に現実のものとなっています. 実際、テクノ愛好家を除いて、どれだけの人が短期的に人工知能の同様のパフォーマンスを目指したり、可能だと信じたりしたでしょうか? 強調された制限にもかかわらず、AI の葉の表示は実際には驚くべきものです。 「驚くべき技術」とは、ダンディー大学のクリス・リード教授のコメントです。

Ovadia 自身も感銘を受けました。 イスラエルのチャンピオンは、システムを完成させる目的で、IBM オートマトンと数か月間競争する機会がありました。私が言ったことに耳を傾け、意味のある応答をする能力。

まさに Ovadia が示した独特の「品質」は、Project Debater を「非常に特別な技術 ... 人工知能技術の開発における重要なマイルストーン」にする主な特徴の XNUMX つです。 IBMイスラエルのマネージャー。 要するに、ディベーターの独創性は XNUMX つの革新的なスキルに基づいています。「…それぞれが AI の分野で新しい地平を切り開く XNUMX つの重要なスキル」です。

1) まず、利用可能なデータに基づいてスピーチを書き、説明します。 「最初の試みは、新聞の社説と同様に、データに基づいて意見を生成し、それを完全な文章で表現できるコンピューターを作成することでした」.

2) 第二に、最も重要な概念を認識して推測するために、対話者の返答を聞くこと。 「XNUMX つ目の機能により、ロボットは相手の話を聞いて理解できるようになり、長く連続した話し言葉に隠された重要なステートメントを識別できるようになります。」

3) 最後に、「倫理的」推論を可能にするために、人間が表明した疑問に関連する単一の知識グラフを作成します。 「XNUMX つ目の偉業は、コンピューターに人間のジレンマを簡潔に、原則に基づいた議論で表現する能力を与えたことです。」

しかし、討論者のパフォーマンスには欠陥がないわけではありませんでした。 異なる言葉を使って同じ概念を何度も繰り返したことに加えて、ある時点で、宇宙探査に関する議論の中で、彼は「…良い道路やより良い学校や高校の健康管理よりも重要である」と主張しました. . 本当に共有できない議論…

いくつかの言語的な不確実性は別として、場合によっては文の構成が完全に「自然」ではないという印象を受けました。 時々、逸話や引用はほとんどカジュアルに見えます。 ある時点で、文の途中に「ナレーション」が挿入され、マシンがビデオのトランスクリプトを盗用したことが明らかになりました。

とはいえ、IBM の新しい「ミラビリア」は独自のものでした。 Chris Reed が指摘するように、私たちは些細なことではない進歩を示すパフォーマンスを目の当たりにしました。 討論のようなものに入ることは、成功するか失敗するかではありません。 …多くの問題を解決できなければならず、それらすべての問題を組み合わせて設計されたソリューションにする必要があります。」

結論

マシンは共感の欠如を示し、人工知能分野の研究の現在の限界を明らかにし、AI の将来と機能に関する議論に致命的なさらなる材料を提供しました。 さらに、人間と機械の間のますます緊密なコラボレーションを称賛するアクセントを置く多くの宣言にもかかわらず、AI は非常に補助的な役割を果たしていると言われていますが、競争の幽霊が威圧的に再び現れています。 このすべてにおいて、人間はどのような役割を果たし、どのような機能を果たすのでしょうか? それはその「有用性」を維持することができるでしょうか、それはそれ自身の存在空間、日々小さく見える境界内の独特の独自性を維持することができるでしょうか、それともそれは限界的な要素になり、さらには冗長になるでしょうか?

最後に、詳しく調べてみると、Project Debater の暗い側面も明らかになります …

IBM は、Project Debater の将来のアドバイザーの役割を想定しています。 「私たち人間を理解できる人工知能には、大きな可能性があると信じています」とクリシュナは言います。 偏見がなく、感情がなく、したがって気分や環境の影響を受けず、特定のトピックについて客観的な見方を提供できるカウンセラー。 「これにより、証拠に基づく意思決定のレベルを上げることができます」と Chris Reed 氏は述べています。

決定に内在する長所と短所を同時に提供できるツールです。 「時間の経過とともに、このアプリケーションと互換性のあるビジネス環境では、まだ解決されていない問題について、推論、問題解決を促進するために、この AI システムの使用にますます移行する予定です」

もちろん、機械の役割は意思決定を行うこと (人間に取って代わること) ではなく、「テーブルで別の声として行動する」という議論に貢献することが何度か強調されています。 ビッグ・ブルーによれば、プロジェクト・ディベーターの機能は、「効果的かつ効率的な統合に到達するために、思考、意見、視点、考察をよりよく循環させる「ファシリテーター」の機能になるだろう... 「シンカー」.生身の思想家の骨の奉仕で」.

刺激的で、心強い展望です。 しかし、ちょっと別の次元を想像してみましょう。 止められない技術進歩の物語が私たちに約束する「壮大で進歩的な運命」とは異なり、遠いディストピアの未来。 データで飽和し、ニュースであふれ、情報が混乱している世界を想像してみましょう。 偽のニュースに悩まされている情報…

また、ニュースに秩序をもたらし、情報の混乱を整理するためではなく、プロジェクト ディベーターなどのツールの品質が採用された場合、実際にはこの無秩序を増大させ、意見を別の方向ではなく一方向に向けるために使用されたのでしょうか? 偽のニュースを特定して明らかにする代わりに、新しいニュースを作成し、ネットワークを氾濫させ、虚偽または歪曲されたニュースだけでなく、真実をありそうなニュースに置き換えるために使用されたらどうなるでしょうか? それは可能でしょうか? 特にソーシャルメディアの世界では、コミュニケーションやニュースが必ずしも特に洗練されたり、明確に表現されたりする必要がないため、多大な努力をしなくてもそうであると考えられます。

このようなツールは、一種の「アラカルト」の思想家になる可能性があります。 さらに悪いことに、影響を与えたり、指示したり、説得したりして、継続的な流れの中で提案や「手配」を行うことができる自動化されたものはたくさんあるので、感謝します. 事実と要素を仕立ての正確さで組み立て、さらに、人間には想像を絶するペースで結合と分離を行うことができる楽器。 私たちとはかけ離れた現実、過度にディストピア? 多分 …

レビュー