Поделиться

Машина превосходит человека: от Deep Blue до Alfa Go вызов алгоритмов

Со времен шахматного матча между Deep Blue и чемпионом мира Гарри Каспаровым искусственный интеллект уже двадцать лет бросает вызов человеку, но в 2016 году обгон стал реальностью: алгоритм Deep Mind победил чемпиона мира по GO и на этот раз без споров.

На дворе 1996 год. Мир быстро облетает новость, вызывая ажиотаж и восхищение: впервые компьютеру удается победить чемпиона мира по шахматам. Это было 10 февраля 1996 года, когда Deep Blue, компьютер, разработанный и построенный IBM специально для игры в шахматы, победил обладателя титула Гарри Каспарова. в первом матче вызова человек-калькулятор. Это историческая дата, искусственный интеллект достигает цели, которую большинство считает недостижимой, недостижимой, закрытой для машин. Хотя суперкомпьютер IBM взял верх над Каспаровым в первой партии, в конечном итоге противостояние закрепилось за победой чемпиона России. В последующих матчах Deep Blue не удается повторить первоначальный успех и в итоге три победы Каспарова и две ничьи. Человек бьет машину 4-2.

Многие вздыхают с облегчением, человечество сохраняет свое первенство. Обгон компьютеров в ущерб человеку, возможно, больше не является исключительной темой научной фантастики, но, по крайней мере, это еще впереди. Больше ничего плохого! В следующем году между двумя соперниками происходит реванш, и на этот раз Deep Blue побеждает. Следовательно, в мае 1997 года компьютер побеждает человека: 3,5-2,5. Предел перейден, стена разрушена.

Гарри Каспаров реконструировал этот упущенный вызов в недавно изданной 300-страничной книге под названием «Глубокое мышление: где заканчивается искусственный интеллект и начинается человеческое творчество».

Тем не менее, событие не без споров. Во-первых, Deep Blue находится не внутри помещения, в котором проходит матч, а в нескольких километрах от него, и, следовательно, данные не отправляются напрямую с компьютера. Этот факт и другие элементы заставляют Каспарова утверждать, что Deep Blue помогали во время матчей. Элемент, возвращающийся несколько раз во время вызова, и отказ IBM на просьбу Каспарова предоставить распечатки, касающиеся деятельности машины, в соответствии с предыдущими договоренностями, только усиливают сомнения и подогревают подозрения. В конце концов проигравший просит о матче-реванше, но IBM выступает против прямого отказа, окончательно отзывая Deep Blue.

20 лет спустя появляется алгоритм Deep mind

В документальном фильме 2003 года «Игра окончена: Каспаров и машина» предлагаются интервью с некоторыми свидетелями, которые бросили тяжелую тень на победу суперкомпьютера. Из них следовало, что в конечном счете Deep Blue представляла собой уловку, реализованную IBM для увеличения стоимости своих акций на фондовой бирже. За один день победы над Каспаровым акции IBM выросли на 15%.

Так что победа машины, в частности, возможно, гораздо более гуманна, чем предполагалось изначально. Или результат случайности, как утверждает Нейт Сильвер. В своей книге (Сигнал и шум. Искусство и наука прогнозирования) он приписывает успех Deep Blue абсолютно иррациональному ходу, результату случая, сделанному машиной. Шаг, который непоправимо дестабилизировал бы человечность Каспарова, подорвав его доверие и рациональность.

Двадцать лет спустя AlphaGo преодолевает еще один предел. Алгоритм Deep Mind в первые месяцы 2016 года побеждает, на этот раз без споров и уловок, сначала чемпиона Европы, а затем чемпиона мира по ГО. Победа явная и безоговорочная. А о том, что машина действительно способна превзойти человека, свидетельствует тот факт, что за одну неделю, с 29 декабря 2016 года по 4 января 2017 года, замаскированная AlphaGo сумела одержать шестьдесят побед подряд над лучшими игроками планеты в плоть.

Расчетная мощность: 10170 

До недавнего времени считалось, что какие-то отдельные области останутся исключительной прерогативой человека или, в худшем случае, останутся таковой еще долгое время. Среди них были и шахматы, и го.Обе игры, хотя и имеют скудные правила и внешне простую динамику, на самом деле скрывают высокую сложность. Сложность, определяемая количеством комбинаций ходов и, следовательно, возможных конфигураций игры. Такое большое число, что можно подумать, что ни один компьютер не смог бы справиться с такой сложностью. Поэтому было распространено мнение, что шахматы и тем более го останутся прерогативой человеческого разума и, прежде всего, интуиции. Тем более не ожидали такой внезапной капитуляции.

Но если Deep Blue удалось победить грубой силой, благодаря огромной вычислительной мощности (способной просчитывать 220 миллионов ходов в секунду), то для AlphaGo дело обстоит иначе. В го гораздо больше комбинаций, чем в шахматах. На каждый ход в среднем шансов в десять раз больше. Одних вычислительных мощностей, пусть и огромных, не хватило бы, чтобы учесть около 10170 различных ситуаций и в то же время правильно определить подводные камни, которые таит в себе игра.

Так как же AlphaGo удалось победить чемпиона мира? Простой, обучающий.

Глубокое обучение, секретное оружие машины

Как говорит Демис Хассабис, основатель Deep Mind, есть два способа сделать компьютер умнее. Первый метод предусматривает программирование определенного решения данной проблемы и предоставление машине возможности выполнить его. Второй, и это касается AlphaGo, состоит в том, чтобы «… дать компьютеру возможность учиться у самого себя, учиться на опыте. … Я научу вас учиться, я не дам вам решения».

Секрет успеха AlphaGo называется Deep Learning. «Алгоритм имеет три функции, взятые из нейробиологии: обучение с подкреплением, сверточные нейронные сети и выборочные петли памяти».

Еще одна особенность, отличающая AlphaGo от Deep Blue, заключается в том, что существо Deep Mind не было создано специально и исключительно для игры в го. Доказано, что лежащий в его основе алгоритм со временем способен обучаться и адаптироваться к различным типам игр. Его прогресс и приобретения на самом деле не являются результатом тщательного и скрупулезного планирования, а являются результатом опыта. То, что она знает, AlphaGo открыла и усвоила, играя, в полной автономии. «Отличительной чертой нового поколения алгоритмов является то, что они, как и люди, учатся на своих успехах и неудачах».

Алгоритм Deep Mind, обученный на 49 различных играх для Atari 2600, затмил не только другие конкурирующие алгоритмы, но и людей. «… в 29 из этих игр алгоритм превзошел профессионального тестировщика-человека на 75 и более процентов, иногда превосходя их с очень большим отрывом».

Когнитивные вычисления

AlphaGo демонстрирует, что сейчас мы вступаем в то, что IBM называет третьей эрой обработки данных: эпохой когнитивных вычислений. В первую эру, эпоху табличных вычислений, с самого начала и до 50-х годов компьютеры были способны выполнять основные математические операции, используя перфокарты как для ввода, так и для вывода. Вторая эра, эра программирования вычислений, с 50-х годов до наших дней, является эрой электронных компьютеров. Машины также могут обрабатывать команды (если/то) и логические структуры, но они должны быть проинструктированы об этом, следуя определенным правилам, и, следовательно, должны быть запрограммированы.

Когнитивные вычисления, объясняет Джонас Нвуке (IBM), «…были созданы, чтобы разрушить жесткость, присущую логике «если/то»… Когнитивные вычисления — это вероятностная разработка, результаты которой варьируются в зависимости от спектра, а не строго «да или нет». нет, правильно или неправильно»».

Акцент, сделанный IBM на Cognitive Computing, по крайней мере отчасти корыстен, это один из винтиков мощной маркетинговой машины, которую не удовлетворила победа над Каспаровым. На самом деле у AlphaGo есть предшественник или, если хотите, у Deep Blue был преемник. Суперкомпьютер, преодолевший очередной барьер, лишил человека еще одного охотничьего заповедника, лишив его дальнейшей уверенности: одним словом, Ватсона.

С Ватсоном разберемся в следующем посте

Обзор