comparte

Nace IBM Project Debater, el robot que sabe lidiar con los debates

El equipo de IBM en Israel lanza el primer sistema de inteligencia artificial capaz de discutir temas complejos con humanos - En los últimos meses, las dos primeras comparaciones públicas en las que la máquina de IBM demostró todas sus impresionantes capacidades, incluso si reveló límites de empatía.

Nace IBM Project Debater, el robot que sabe lidiar con los debates

Era 2012: Nacía Project Debater

Siete años después de la actuación de Watson, capaz de asombrar al vencer a los campeones de carne y hueso del juego Jeopardy!, IBM vuelve a intentar asombrar presentando su nueva criatura: IBM Project Debater.

Después del brillante éxito de 2011, llegó el momento de que Big Blue estableciera una nueva empresa. “Todos los miles de investigadores… recibieron el mismo correo electrónico preguntándoles cuál debería ser el próximo gran desafío de IA para IBM Research”, recuerda Noam Slonim, miembro del centro de investigación de IBM en Haifa (Israel). No había especificaciones precisas, sin embargo, el nuevo proyecto debería haber cumplido ciertas características, ser sobre todo «… científicamente interesante y estimulante y debería tener algún valor comercial. Algo grande, algo que habría marcado la diferencia". Fue el propio Slonim quien propuso perseguir el objetivo de crear y entrenar una inteligencia artificial que pudiera debatir significativamente con una contraparte humana. En un principio, una sugerencia corriente que, finalmente, un año después consiguió imponerse al resto de propuestas de la competencia y se convirtió en el nuevo reto en el que IBM Research había decidido centrarse.

Fruto de seis años de trabajo de un equipo de IBM coordinado por el laboratorio de Haifa en Israel, el proyecto tiene como objetivo desarrollar una IA capaz de interactuar plenamente con los humanos. Pero, "¿Qué es Project Debater?" La pregunta la hace el propio Big Blue, que también da la respuesta: «Un sistema que lleva la inteligencia artificial al arte del debate». En esencia, como se cuida en señalar la compañía, «Project Debater es el primer sistema de inteligencia artificial capaz de debatir temas complejos con humanos».

Los hechos

El Watson West en San Francisco en junio pasado fue el sitio de dos debates inusuales entre expertos humanos y la última maravilla producida por IBM. El esquema de comparación elegido asignó un total de diez minutos a los disertantes, de acuerdo con este orden: cuatro minutos para presentar la tesis propia, cuatro minutos para replicar y refutar la del oponente, dos minutos para una afirmación concluyente.

El tema de discusión del primer contradictorio fue: "¿Deberíamos subsidiar la exploración espacial?". Contra Noa Ovadia, campeona de debate israelí en 2016, a favor de la máquina.

The Project Debater argumentó su tesis argumentando que apoyar la exploración espacial ayuda al avance de la ciencia, abre la mente de las nuevas generaciones y se convierte en fuente de inspiración para ellas: «…inspira a nuestros chicos a seguir formaciones y carreras en ciencia, tecnología y matemáticas». Incluso añadió una anotación que hace un guiño a la grandeza de Estados Unidos: "... poseer un programa de exploración espacial es un elemento fundamental para ser una gran potencia". ¿Intentó cautivar al público presente?

Sin embargo, según Noa Ovadia, los fondos podrían destinarse a otras áreas de investigación, aquí en la tierra. La réplica de la máquina evitó una colisión frontal y se centró en que las repercusiones de las inversiones en exploración espacial, los deseables beneficios tecnológicos y económicos que se derivarían de ellas, serían mayores que los costes incurridos: «Es bastante fácil decir que hay cosas más importantes en las que invertir dinero, y no lo discuto. Nadie afirma que este es el único artículo en nuestra lista de compras. Pero este no es el punto. Dado que subsidiar la exploración espacial definitivamente beneficiaría a la sociedad, creo que es algo que el gobierno debería perseguir".

El segundo debate enfrentó a la IA de IBM contra Dan Zafir, otro experto israelí, sobre el tema: "¿Deberíamos aumentar el uso de la telemedicina?". En ambas discusiones, Debater mostró su "preparación" y la inmensidad de las fuentes en las que se basa, con citas que van desde "... un jeque de los Emiratos Árabes Unidos, hasta la cantidad de trabajos que habría producido la exploración espacial: según un ministro alemán de Asuntos Económicos.

Al concluir su réplica, el autómata se basó en un chiste: «Soy un auténtico partidario del poder de la tecnología… como debe ser». Es difícil establecer si lo hizo para enmascarar la dificultad de responder a los comentarios de su interlocutor, como sugirió Dieter Bohn, o para tratar de congraciarse con la audiencia. Sin embargo, la ironía de la máquina no fue involuntaria, ni por casualidad ni por algún error, sino que es fruto del trabajo de los técnicos de IBM. En varias ocasiones, de hecho, la IA ha incursionado en bromas o chistes, a veces con éxito, a veces con menos éxito.

El veredicto

Es importante señalar que el Debatidor, «… salvo una breve introducción», no fue instruido previamente, ni siguió ningún guión previamente elaborado. Ed Arvind Krishna, Jefe de Investigación de IBM, desea subrayar esto: «Para las primeras demostraciones de esta nueva tecnología, elegimos de una lista de temas seleccionados para garantizar una discusión significativa. Sin embargo Project Debater nunca fue capacitado en los temas». De hecho, el tema del debate fue elegido de una lista compuesta por alrededor de cien temas, para los cuales IBM cree que la IA, basada en los datos almacenados en su memoria, es capaz de medirse con un ser humano. Noam Slonim, «…estimó que la tecnología podría sostener un debate “significativo” sobre esos 100 temas el 40% del tiempo».

La cantidad de información en la que Project Debater pudo confiar es enorme. Incluye varios cientos de millones de documentos de los tipos más dispares: desde páginas de Wikipedia hasta artículos y ensayos, pasando por material de audio y vídeo, «… una colección de 300 millones de artículos, noticias y trabajos académicos, previamente indexados a efectos de una rápida buscar". Indexado y rigurosamente examinado por ingenieros de IBM.

Al concluir las dos comparaciones, una audiencia de periodistas y analistas fue convocada para decretar un ganador sobre la base de dos categorías fundamentales: la exposición de los argumentos y el enriquecimiento en términos de conocimiento que aportan los contendientes. En resumen, el "jurado" improvisado reconoció que la criatura de IBM ha demostrado poseer elementos de conocimiento relevantes sobre los temas planteados, aunque los contrincantes de carne y hueso han sido superiores en exposición. Mientras que en el primer debate la victoria fue para el ser humano, en el segundo la IA se consideró más persuasiva. Si Noa Ovadia consiguió que dos espectadores se pusieran de su lado, nueve personas admitieron haber cambiado de opinión sobre el uso de la telemedicina gracias a los argumentos aportados por el Project Debater. Aunque, como apunta The Guardian, «…había muchos miembros del personal de IBM en la sala y es posible que estuvieran alentando su propia creación», esta vez no hemos sido testigos de un triunfo aplastante de la IA, pero podemos hablar de un empate. . Un lazo que es incluso cercano a nosotros los humanos.

Y una segunda exposición, realizada en julio en Israel frente a una audiencia de periodistas, lo demostró. La máquina de IBM enfrentada a dos expertos en debate israelíes, Yaar Bach y Hayah Goldlist Eichler, parecía menos brillante. Los temas abordados fueron respectivamente: vigilancia masiva e ingeniería genética. Como en el anterior evento organizado en San Francisco, el autómata de IBM fue capaz de superar en carne y hueso a sus contrincantes en cuanto a información y conocimiento. Sin embargo, nuevamente, se quedó corto al presentar sus argumentos y, por así decirlo, en el énfasis de la exposición. En conclusión, «el sistema y Bach empataron, sin embargo en la segunda ronda la victoria fue para Goldlist Eichler, quien logró cambiar la opinión de más personas en la audiencia, a pesar de obtener una puntuación más baja en el conocimiento del tema».

El día después

"Piensa un momento en ello. Un sistema de inteligencia artificial interactuó con un experto humano en un debate, escuchó su argumento y respondió de manera convincente con su propio razonamiento sin guión para persuadir a la audiencia a considerar su posición sobre un tema controvertido. Arvind Krishna nos proyecta de repente a otra dimensión que, hasta ahora, era un coto de caza para películas de ciencia ficción o documentales sobre un futuro plausible, más o menos futuro. D'emblée, incluso con todas las incertidumbres y deficiencias mostradas por la máquina, ese futuro se ha convertido en parte en una realidad. De hecho, ¿cuántos, excluidos los entusiastas de la tecnología, habrían apuntado o solo creído posible un desempeño similar de la inteligencia artificial en el corto plazo? A pesar de las limitaciones destacadas, la visualización de la IA deja asombrado. Una "tecnología notable", fue el comentario de Chris Reed, profesor de la Universidad de Dundee.

La propia Ovadia quedó impresionada: "Estoy sorprendida... La tecnología es verdaderamente desconcertante en cuanto a cuántas capacidades cognitivas propiamente humanas es capaz de realizar simultáneamente". El campeón israelí tuvo la oportunidad de competir con el autómata de IBM durante unos meses, con el propósito de finalizar el sistema: «Al principio me asombró, tanto por el lenguaje sencillo, como por la construcción del argumento... El capacidad de escuchar y luego dar una respuesta significativa a lo que dije.

Precisamente las peculiares "cualidades" señaladas por Ovadia se encuentran entre las principales características que hacen del Proyecto Debater, una "tecnología bastante especial... un hito significativo en el desarrollo de una tecnología de Inteligencia Artificial", según afirma Daniel Melka, CEO y Country gerente de IBM Israel. En esencia, la originalidad del Debater se basa en tres habilidades innovadoras, «... tres habilidades cruciales, cada una de las cuales abre nuevos horizontes en el campo de la IA».

1) En primer lugar redacción y exposición de un discurso a partir de los datos disponibles. "El primer emprendimiento fue la creación de una computadora capaz de generar una opinión -similar a la editorial de un periódico- construida a partir de datos y expresarla en oraciones completas".

2) En segundo lugar, escuchar la respuesta del interlocutor, para reconocer y extrapolar los conceptos más importantes. “La segunda capacidad permite que el robot escuche y comprenda a sus oponentes, lo que le permite identificar declaraciones clave ocultas en un lenguaje hablado largo y continuo”.

3) Finalmente, la creación de un único gráfico de conocimiento, relacionado con las dudas expresadas por el hombre, para permitir el razonamiento "ético". "La tercera hazaña fue darle a la computadora la capacidad de expresar los dilemas humanos de manera sucinta y con argumentos basados ​​en principios".

Sin embargo, la actuación de Debater no estuvo exenta de fallas. Además de haber repetido varias veces el mismo concepto con diferentes palabras, en un momento, durante el debate sobre la exploración espacial, argumentó que esto «…es más importante que [tener] buenas carreteras o mejores escuelas o una sanidad de bachillerato» . Un argumento que no es realmente compartible...

Aparte de algunas incertidumbres lingüísticas, en algunos casos teníamos la impresión de que la construcción de la oración no era del todo "natural": a veces el segmento inicial de un enunciado no iba seguido de una segunda parte que parecía fluida; a veces, entonces, las anécdotas y las citas han parecido casi casuales. En un momento, en medio de una oración, una inserción de "voz en off" reveló que la máquina había accedido a una transcripción de video.

No obstante, los nuevos “mirabilia” de IBM se mantuvieron firmes. Como señala Chris Reed, hemos sido testigos de una actuación que denota un progreso que es cualquier cosa menos trivial: «Este es realmente un paso adelante significativo… Creo que lo que me llamó la atención fue la combinación de técnicas de Inteligencia Artificial. Entrar en algo como un debate no es algo de hacer o romper. … Tienes que ser capaz de resolver muchos problemas y luego reunir todos esos problemas en una solución de ingeniería”.

Conclusiones

La máquina ha mostrado falta de empatía, ha revelado los límites actuales de la investigación en el campo de la inteligencia artificial y ha aportado fatalmente más material a la discusión sobre el futuro y la función de la IA. Además, a pesar de las numerosas proclamas que ponen el acento en aplaudir una colaboración cada vez más estrecha entre el hombre y la máquina, con la IA, se nos dice, jugando un papel eminentemente secundario, el fantasma de la competencia reaparece de manera prepotente. ¿Qué papel jugará el hombre en todo esto, qué función jugará? ¿Será capaz de mantener su "utilidad", conservará su propio espacio de existencia, una singularidad peculiar dentro de un perímetro que cada día parece más pequeño, o se convertirá en un elemento marginal, incluso redundante?

Finalmente, en una inspección más cercana, Project Debater también revela su propio lado oscuro...

IBM prevé un futuro rol de asesor para Project Debater. “Creemos que existe un enorme potencial positivo en la inteligencia artificial que puede entendernos a los humanos”, dice Krishna. Un consejero libre de prejuicios, libre de emociones y, por lo tanto, inmune a las influencias ambientales y del estado de ánimo, capaz de proporcionar una visión objetiva de un tema determinado. “Esto puede elevar el nivel de la toma de decisiones basada en evidencia”, señala Chris Reed.

Una herramienta incluso capaz de ofrecer al mismo tiempo los pros y los contras inherentes a una decisión. “Con el tiempo, y en entornos empresariales compatibles con esta aplicación, avanzaremos cada vez más hacia el uso de este sistema de IA para facilitar el razonamiento, la resolución de problemas, sobre cuestiones que aún no han sido resueltas”, insiste en reiterar IBM.

Eso sí, se insiste con fuerza en varias ocasiones en que el papel de la máquina no será el de tomar decisiones (en sustitución del hombre), sino el de contribuir a la discusión, «… actuar como una voz más en la mesa». La función del Project Debater, según Big Blue, "será la de 'facilitador' para hacer circular mejor pensamientos, opiniones, puntos de vista y reflexiones para llegar a una síntesis eficaz y eficiente... un 'Pensador' al servicio de huesos pensadores de carne y hueso".

Una perspectiva estimulante, incluso tranquilizadora. Pero imaginemos, por un momento, otra dimensión. Un futuro distópico, distinto y distante de las "magníficas y progresivas fortunas" que nos promete la narración del imparable progreso tecnológico. Imaginemos un mundo saturado de datos, abarrotado de noticias, con información abrumadora y confusa. Una información poblada y plagada de fake news...

¿Y si las cualidades de herramientas como Project Debater se emplearan en lugar de poner orden en las noticias y resolver el caos de la información, en realidad para aumentar este desorden, así como para orientar las opiniones en una dirección en lugar de otra? ¿Y si en vez de identificar y revelar noticias falsas, se utiliza para hacer otras nuevas, inundar la red, y no solo, con noticias falsas o tergiversadas, sustituir lo verdadero por lo probable? ¿Sería posible? Es presumible que lo sea y sin mucho esfuerzo, especialmente en el mundo de las redes sociales, donde la comunicación y las noticias no necesariamente tienen que ser particularmente refinadas o articuladas.

Tal herramienta podría convertirse en una especie de Pensador “a la carta”. Peor aún, un Pensar agradecer, pues hay muchos, pero automatizados, capaces de hacer sugerencias y “arreglos” en un flujo continuo, de influir, orientar, persuadir. Un instrumento capaz de ensamblar hechos y elementos con precisión sartorial, de unir y desunir, además, a un ritmo inimaginable para un ser humano. ¿Una realidad lejana a nosotros, excesivamente distópica? Tal vez …

Revisión