Рождение IBM Project Debater, робота, умеющего вести дебаты

Команда IBM в Израиле запускает первую систему искусственного интеллекта, способную обсуждать сложные темы с людьми. В последние месяцы были проведены первые два публичных сравнения, в которых машина IBM продемонстрировала все свои впечатляющие возможности, даже если она показала пределы эмпатии.

Это был 2012 год: родился проект «Дебатер».

Спустя семь лет после выступления Уотсона, способного удивить, победив чемпионов из плоти и крови в игре Jeopardy!, IBM снова пытается удивить, представляя свое новое творение: IBM Project Debater.

После блестящего успеха 2011 года для Big Blue пришло время создать новое предприятие. «Каждый из тысяч исследователей… получил одно и то же электронное письмо с вопросом о том, какой следующей большой задачей ИИ должен стать для IBM Research», — вспоминает Ноам Слоним, сотрудник исследовательского центра IBM в Хайфе (Израиль). Точных спецификаций не было, тем не менее новый проект должен был удовлетворять определенным характеристикам, прежде всего быть «…научно интересным и стимулирующим и иметь некоторую коммерческую ценность. Что-то большое, что-то, что имело бы значение». Сам Слоним предложил преследовать цель создания и обучения искусственного интеллекта, способного вести осмысленные дебаты с человеческим аналогом. Сначала это было обычное предложение, которое, наконец, через год сумело победить другие конкурирующие предложения и стало новым вызовом, на котором IBM Research решила сосредоточиться.

Результат шестилетней работы команды IBM, координируемой лабораторией Хайфы в Израиле, проект направлен на разработку ИИ, способного полностью взаимодействовать с людьми. Но "Что такое проектный дебатер?" Вопрос задает сам Big Blue, который также дает ответ: «Система, которая привносит искусственный интеллект в искусство дебатов». По сути, как осторожно отмечает компания, «Project Debater — это первая система искусственного интеллекта, способная обсуждать сложные темы с людьми».

Факты

Watson West в Сан-Франциско в июне прошлого года стал местом двух необычных дебатов между экспертами-людьми и последним чудом, произведенным IBM. Выбранная схема сравнения отводила докладчикам в общей сложности десять минут в следующем порядке: четыре минуты на изложение собственного тезиса, четыре минуты на ответ и опровержение тезиса оппонента, две минуты на заключительное заявление.

Тема обсуждения первой противоречиво звучала: «Должны ли мы субсидировать освоение космоса?». Против Ноа Овадия, чемпиона Израиля по дебатам 2016 года, за машину.

Участник проекта аргументировал свой тезис тем, что поддержка исследования космоса помогает развитию науки, открывает умы новых поколений и становится для них источником вдохновения: «… это вдохновляет наших детей на обучение и карьеру в области науки, техники и математики». Он даже добавил примечание, намекающее на величие США: «…владение программой освоения космоса — фундаментальный элемент великой державы». Пытался ли он увлечь присутствующую публику?

Однако, по словам Ноа Овадиа, средства могут быть предназначены для других областей исследований здесь, на Земле. Реплика машины избежала лобового столкновения и сосредоточилась на том, что последствия инвестиций в освоение космоса, желаемые технологические и экономические выгоды, которые они могли бы извлечь из них, будут больше, чем понесенные затраты: «Это довольно легко сказать, что есть вещи, куда лучше всего вкладывать деньги, и я не спорю с этим. Никто не утверждает, что это единственный пункт в нашем списке покупок. Но дело не в этом. Поскольку субсидирование освоения космоса определенно пойдет на пользу обществу, я думаю, что это то, чем должно заниматься правительство».

Во втором дебате ИИ IBM столкнулся с Дэном Зафиром, другим израильским экспертом, на тему: «Должны ли мы расширять использование телемедицины?». В обеих дискуссиях участник дебатов продемонстрировал свою «подготовку» и обширность источников, на которые он опирался, с цитатами, начиная от «... шейха из Объединенных Арабских Эмиратов и заканчивая количеством рабочих мест, которые могли бы быть созданы в результате освоения космоса. по словам министра экономики Германии.

В заключение своего ответа автомат пошутил: «Я искренний сторонник силы технологий… как и должно быть». Трудно установить, сделал ли он это для того, чтобы замаскировать трудности с реакцией на замечания своего собеседника, как предполагает Дитер Бон, или для того, чтобы снискать расположение аудитории. Однако ирония машины не была ни невольной, ни случайной, ни какой-то ошибкой, а является результатом работы технических специалистов IBM. Фактически, в нескольких случаях ИИ отваживался на шутки или шутки, иногда успешные, иногда менее удачные.

Приговор

Важно отметить, что Участник дебатов, «…за исключением краткого вступления», не был предварительно проинструктирован и не следовал какому-либо заранее подготовленному сценарию. Эд Арвинд Кришна, глава исследовательского отдела IBM, подчеркивает это: «Для первых демонстраций этой новой технологии мы сделали выбор из списка выбранных тем, чтобы обеспечить содержательное обсуждение. Однако Project Debater никогда не обучался этим темам». Тема дебатов фактически была выбрана из списка, состоящего примерно из сотни тем, по которым IBM считает, что ИИ на основе данных, хранящихся в его памяти, способен сравнивать себя с человеком. Ноам Слоним, «…подсчитал, что технология может поддерживать «значимые» дебаты по этим 100 темам в 40% случаев».

Объем информации, на которую мог положиться участник дискуссии по проекту, огромен. Он включает в себя несколько сотен миллионов документов самых разрозненных типов: от страниц Википедии до статей и очерков, а также аудио- и видеоматериалов, «…собрание из 300 миллионов статей, новостей и академических работ, ранее проиндексированных в целях быстрого поиск". Индексировано и тщательно проверено инженерами IBM.

По завершении двух сравнений аудитории журналистов и аналитиков было предложено определить победителя на основе двух основных категорий: представление аргументов и обогащение знаний с точки зрения претендентов. Таким образом, импровизированное «жюри» признало, что существо IBM продемонстрировало наличие соответствующих элементов знаний по затронутым вопросам, хотя противники из плоти и крови были лучше в изложении. Если в первом споре победа досталась человеку, то во втором ИИ был признан более убедительным. Если Ноа Овадия сумела привлечь на свою сторону двух зрителей, девять человек признались, что изменили свое мнение об использовании телемедицины благодаря аргументам, предоставленным участником проекта. Хотя, как отмечает The Guardian, «…в зале было много сотрудников IBM и, возможно, они болели за собственное творение», на этот раз мы не стали свидетелями сокрушительного триумфа ИИ, но можем говорить о ничьей . Галстук, который близок даже нам, людям.

И вторая выставка, прошедшая в июле в Израиле перед аудиторией журналистов, это доказала. Машина IBM, противопоставленная двум израильским экспертам по дебатам, Яару Баху и Хайе Голдлисту Эйхлеру, выглядела менее блестящей. Были затронуты следующие вопросы: массовое наблюдение и генная инженерия. Как и на предыдущем мероприятии, организованном в Сан-Франциско, автомат IBM смог превзойти своих противников во плоти с точки зрения информации и знаний. Однако он опять не дотянул до человека в изложении своих доводов и как бы в акцентах изложения. В заключение «система и Бах сыграли вничью, однако во втором туре победа досталась Голдлисту Эйхлеру, который сумел изменить мнение большего числа людей в аудитории, несмотря на более низкие оценки по знанию предмета».

На следующий день

«Подумайте об этом на мгновение. Система ИИ, вовлеченная в дебаты с экспертом-человеком, выслушала ее аргумент и убедительно ответила собственными незаписанными рассуждениями, чтобы убедить аудиторию рассмотреть ее позицию по спорной теме. Арвинд Кришна внезапно переносит нас в другое измерение, которое до сих пор было охотничьим угодьем для научно-фантастических или документальных фильмов о правдоподобном, более или менее будущем, будущем. Дэмбле, даже при всех неуверенностях и недостатках, показанных машиной, такое будущее отчасти стало реальностью. На самом деле, сколько, за исключением техно-энтузиастов, стремились или только верили в возможность аналогичной работы искусственного интеллекта в краткосрочной перспективе? Несмотря на отмеченные ограничения, отображение ИИ действительно поражает. «Замечательная технология», — прокомментировал Крис Рид, профессор Университета Данди.

Сама Овадия была впечатлена: «Я удивлена... Технологии действительно сбивают с толку с точки зрения того, сколько специфических человеческих когнитивных способностей они могут выполнять одновременно». У израильского чемпиона была возможность посоревноваться с автоматом IBM в течение нескольких месяцев с целью доработки системы: «Сначала я был поражен как простым языком, так и построением аргумента… способность слушать, а затем дать осмысленный ответ на то, что я сказал.

Именно специфические «качества», указанные Овадией, являются одними из основных характеристик, которые делают Project Debater «совершенно особой технологией ... важной вехой в развитии технологии искусственного интеллекта», как заявил Даниэль Мелка, генеральный директор и региональное представительство. менеджер IBM в Израиле. По сути, оригинальность Дебатера основана на трех инновационных навыках, «…трех важнейших навыках, каждый из которых открывает новые горизонты в области ИИ».

1) В первую очередь написание и изложение выступления на основе имеющихся данных. «Первой задачей было создание компьютера, способного генерировать мнение — подобно газетной передовице — построенное на данных и выражающее его в полных предложениях».

2) Во-вторых, прослушивание ответа собеседника, чтобы распознать и экстраполировать наиболее важные понятия. «Вторая возможность позволяет роботу слышать и понимать своих противников, позволяя ему идентифицировать ключевые утверждения, скрытые в длинном, непрерывном разговорном языке».

3) Наконец, создание единого графа знаний, относящегося к сомнениям, высказанным человеком, для возможности «этических» рассуждений. «Третий подвиг состоял в том, чтобы дать компьютеру возможность выражать человеческие дилеммы кратко и с принципиальными аргументами».

Однако выступление Дебатера не обошлось без недостатков. В дополнение к тому, что он несколько раз повторил одну и ту же концепцию, используя разные слова, в какой-то момент во время дебатов об освоении космоса он утверждал, что это «… важнее, чем [наличие] хороших дорог или лучших школ или медицинского обслуживания в средней школе ". . Аргумент, на самом деле не разделяемый…

Помимо некоторых лингвистических неопределенностей, в некоторых случаях у нас сложилось впечатление, что построение предложения было не совсем «естественным»: иногда за начальным сегментом высказывания не следовала вторая часть, которая казалась бы текучей; иногда тогда анекдоты и цитаты казались почти случайными. В какой-то момент в середине предложения вставка «голос за кадром» показала, что машина подключилась к стенограмме видео.

Тем не менее, новая «мирабилия» IBM устояла. Как отмечает Крис Рид, мы стали свидетелями спектакля, обозначающего прогресс, который далеко не тривиален: «Это действительно значительный шаг вперед… Я думаю, что меня поразило сочетание методов искусственного интеллекта. Участие в чем-то вроде дебатов не является решающим. … Вы должны быть в состоянии решить множество проблем, а затем объединить все эти проблемы в инженерное решение».

выводы

Машина продемонстрировала недостаток эмпатии, выявила текущие ограничения исследований в области искусственного интеллекта и роковым образом предоставила дополнительный материал для дискуссии о будущем и функциях ИИ. Кроме того, несмотря на многочисленные прокламации, в которых акцент делается на все более тесном сотрудничестве между человеком и машиной, а ИИ, как нам говорят, играет в высшей степени вспомогательную роль, призрак конкуренции вновь появляется властно. Какую роль во всем этом будет играть человек, какую функцию он будет играть? Сможет ли он сохранить свою «полезность», сохранит ли собственное пространство существования, своеобразную уникальность в периметре, который с каждым днем становится все меньше, или же он станет элементом маргинальным, даже избыточным?

Наконец, при ближайшем рассмотрении Project Debater также раскрывает свою темную сторону…

IBM видит будущую роль консультанта для Project Debater. «Мы считаем, что у искусственного интеллекта, способного понимать нас, людей, есть огромный положительный потенциал», — говорит Кришна. Консультант, свободный от предубеждений, свободный от эмоций и, следовательно, невосприимчивый к настроению и влиянию окружающей среды, способный дать объективное представление о данной теме. «Это может повысить уровень принятия решений на основе фактических данных», — отмечает Крис Рид.

Инструмент даже способен предложить одновременно плюсы и минусы, присущие тому или иному решению. «Со временем и в бизнес-средах, совместимых с этим приложением, мы будем все больше и больше переходить к использованию этой системы искусственного интеллекта для облегчения рассуждений и решения проблем по вопросам, которые еще не решены», — повторяет он IBM.

Конечно, неоднократно подчеркивалось, что роль машины будет заключаться не в том, чтобы принимать решения (заменять человека), а, скорее, вносить свой вклад в дискуссию, «… действовать как еще один голос за столом переговоров». Функция участника дискуссии по проекту, согласно Big Blue, «будет заключаться в функции« посредника »в улучшении распространения мыслей, мнений, точек зрения и размышлений для достижения эффективного и действенного синтеза ...« Мыслитель » на службе костей мыслителей из плоти и крови».

Стимулирующая, даже обнадеживающая перспектива. Но давайте представим на мгновение другое измерение. Мрачное будущее, отличное и далекое от «великолепных и прогрессивных состояний», которые обещает нам повествование о неудержимом технологическом прогрессе. Давайте представим мир, насыщенный данными, переполненный новостями, с запутанной информацией. Информация, населенная и изобилующая фейковыми новостями…

А если качества таких инструментов, как Project Debater, использовались не для того, чтобы навести порядок в новостях и разобраться в информационном хаосе, а на самом деле для того, чтобы усилить этот беспорядок, а также направить мнения в одну сторону, а не в другую? Что, если вместо выявления и раскрытия фейковых новостей использовать новые, заливать сеть, и не только, ложными или искаженными новостями, заменять истинные вероятными? Это было бы возможно? Можно предположить, что это так, и даже без особых усилий, особенно в мире социальных сетей, где общение и новости не обязательно должны быть особенно утонченными или артикулированными.

Такой инструмент мог бы стать своего рода Мыслителем «а ля карт». Хуже того, Мысль спасибо, как их много, но автоматизированных, способных вносить внушения и «расстановки» в непрерывном потоке, влиять, направлять, убеждать. Инструмент, способный собирать факты и элементы с портняжной точностью, соединять и разъединять, причем с невообразимой для человека скоростью. Реальность, далекая от нас, чересчур антиутопическая? Может быть …