comparte

El ROBObook: el algoritmo crea contenido

Fernand Léger, La Lecture, 1924, Centro Pompidou, París. En el cuadro Leger, que explora la relación hombre-entorno en el paisaje mecanizado y automatizado, se representan dos monumentales figuras femeninas, una desnuda y otra vestida, que sujetan libros sin descansar la mirada y que miran fijamente al espectador.

El ROBObook: el algoritmo crea contenido

Como también muestra el conjunto anatómico, las figuras ni siquiera parecen "humanas", sino que, en su representación en colores fríos sobre un plano totalmente astrato, aparecen como apéndices funcionales de una poderosa máquina que también produjo las tres improbables flores cortadas que sostiene la figura de la derecha. Tal y como explica la ficha que el museo dedica a la obra, La Lectura "es una de las primeras realizaciones, sin duda la más impresionante, del principio de la figura objeto" que informa el arte del pintor normando.

Libros al volo

Imagínese querer leer sobre cualquier tema y en cualquier nivel de detalle, los libros están todos disponibles pero todavía no hay nada real, tangible; las palabras, las miles de palabras que compondrán el libro aún permanecen inanimadas y desconectadas dentro de una base de datos hasta que alguien ordena el libro en Amazon o en otra librería. En ese momento, en muy poco tiempo, como mucho 20 minutos, el libro estará listo, generado a un costo muy bajo: el de la corriente eléctrica que se usa para mantener la computadora encendida…

La idea de construir libros sobre la marcha viene de Philip M. Parker, profesor de Marketing de la Escuela de Negocios insead. Parker ha creado un software que puede escribir libros sobre temas específicos en unos 20 minutos.  El algoritmo patentado ha generado hasta ahora cientos de miles de libros. De hecho, Amazon enumera más de 100.000 libros atribuidos a Parker y más de 700.000 obras de su empresa, la ícono grupo internacional, Inc.

Parker no es tanto un autor como un compilador, pero el resultado final es el mismo: barcos llenos de obras escritas. Quizás estos libros no son los que la gente lee con más frecuencia. De hecho, las categorías más comunes se refieren a informes técnicos y comerciales, diccionarios de idiomas con el seudónimo “Webster” (que es de dominio público), resúmenes de enfermedades raras y libros de crucigramas para aprender idiomas extranjeros. Pero todos tienen una cosa en común: son generados automáticamente por software. El sistema automatiza este proceso mediante la construcción de bases de datos a partir de las cuales, a través de una interfaz que permite personalizar una pregunta, dibujar información sobre un tema determinado y generar modelos.

Dado que libro electrónico de los Estándares ISTE para estudiantes digitales y servicios Imprimir-on-demand ahora están a la orden del día, los temas están todos listados en Amazon sin siquiera haber sido escritos todavía.

Así es como un extracto de la patente de 2007 describe el sistema: «Esta invención permite la creación, comercialización y distribución automática de contenido. Un ordenador es el autor de los contenidos. El material se formatea automáticamente en el formato deseado para generar un contenido. El contenido también se puede distribuir automáticamente al destinatario. [...] Además, el título se puede escribir a pedido, en cualquier idioma y con contenido actualizado».

La fórmula construircontenido da pregunta

Para ser claro, este no es solo un software, sino un verdadero sistema automático, diseñado para escribir sobre un tema específico. La base de datos del sistema está llena de contenido relevante y patrones específicos codificados para reflejar el conocimiento general, es decir, el resultado escrito por un experto en esa industria o género en particular. Para evitar la infracción de derechos de autor, el sistema está diseñado para evitar el plagio. De hecho, la patente tiene como objetivo crear obras originales que, sin embargo, no necesariamente tienen que ser creativas. En otras palabras, si cualquier tipo de contenido se puede descomponer en una fórmula, entonces se puede empaquetar un número infinito de contenidos diferentes con esa misma fórmula.

Así describe Parker el proceso de creación algorítmica de libros.

El éxito (y la genialidad) de este sistema es que Parker diseñó los algoritmos simulando el proceso mental que necesariamente tendría que hacer un experto para escribir sobre un tema determinado. Se trata “simplemente” de deconstruir contenido dentro de una categoría, y Parker tiene algo de experiencia en esta área, ya que ha escrito al menos tres libros a la antigua. La forma en que funciona el algoritmo de creación de contenido (en la mayoría de los casos) permite codificarlo como inteligencia artificial.

Il catálogo è este

Es instructivo observar una muestra de la lista de libros atribuidos a Parker:

Webster, Diccionario de sinónimos eslovaco-inglés, precio $28,95

Perspectivas mundiales 2007-2012 para asientos de inodoro de madera, precio $795

El mercado mundial de preservativos de goma. En 2007 Mundial Perspectiva Trade, precio $325

el sindrome de Ellis-camioneta Creveld — Diccionario y bibliografía para médicos, pacientes e investigadores de la Genoma Investigación, precio $28,95

Webster, inglés-criollo haitiano. Crucigrama: Nivel 1, precio $14.95

Teniendo en cuenta que producir un título cuesta entre $0,20 y $0,50 (igual al costo de la electricidad y el hardware), los precios que se muestran son casi en su totalidad ingresos, incluso si se venden muy pocos ejemplares...

En realidad, muchos libros de no ficción, como artículos de noticias, los temas a menudo se reducen a fórmulas de "quién, qué, dónde, cuándo y por qué". No importa cómo se presente la información actual o relacionada, debe haber algunos datos esenciales, incluso para los temas más desconocidos. Y Parker no está solo en la automatización de contenido. La startup de Chicago Narrative Science produce noticias, deportes y artículos financieros para Forbes desde hace un tiempo.

Luego, ¿Cuál es el próximo género de libros al que apuntará Parker para un nuevo producto de software? novelas Incluso si una novela es una obra de ficción, no es ningún secreto que algunos géneros, como las novelas románticas, también se prestan a ser matematizados. Es posible que esto no haga que estas obras sean importantes por su valor literario, pero ciertamente tienen un gran valor de entretenimiento y, quizás sorprendentemente, el género romántico tiene la mayor parte del mercado de libros con ingresos de aproximadamente $ 1,37 mil millones en 2011.

Pero, ¿puede la inteligencia artificial hacer un trabajo creativo como un ser humano? Sí… eventualmente. En realidad, las preguntas que hay que hacer son: ¿qué tan pronto sucederá esto? ¿Y qué tan relevante será? Es posible que las respuestas ya estén en el horizonte si Parker puede producir novelas que serán leídas por las masas. Francamente, cualquier trabajo creativo producido por una inteligencia artificial será un "éxito" si lo lees y piensas que un ser humano lo escribió o, más precisamente, que una inteligencia humana está en el origen del trabajo.

Ahora Parker está pensando en crear una base de datos de contenido que vaya más allá de los libros y que pueda usary el mismo motor que el ROBObook.

Encima i libros

Pero los libros pueden ser sólo el comienzo. Como señala Parker en su video, el software no debe limitarse únicamente a las obras escritas. Usando animaciones 3D y avatares, se puede generar una amplia variedad de formatos de audio y video que, según Parker, están en desarrollo. Los avatares que leen las nuevas historias elaboradas por el software podrían ponerse de moda, sobre todo si los espectadores pueden personalizarlo y decidir el nivel de detalle.

La tecnología de generación de contenidos podría converger con otros desarrollos, como la creación automática de subtítulos para ampliar el contenido. La figura del traductor se volvería imprescindible no solo para traducir contenidos producidos anteriormente sino también audio y vídeo en tiempo real. Además, con los blogs sociales que permiten a las personas capturar todo lo que se dice o se dice sobre ellos, estos datos podrían usarse para construir biografías personales reales.

Finalmente, si agrega estadísticas sobre grandes números a la mezcla, podría tener la capacidad de generar contenido importante, todo realizado por computadoras diseñadas específicamente.

El futuro del contenido se está convirtiendo cada vez más en ciencia ficción, pero todavía se necesitan algunos años antes de que su creación esté completamente en manos del software. Pero si tienes alguna duda de hacia dónde vamos, considera que la primera novela escrita por computadora ya se publicó hace 7 años.

¿Una nueva línea de montaje? Nosotros también terminaremos tragados por los algoritmos de Parker como el pobre Charlot por los engranajes de la máquina herramienta en Tiempos modernos?

Revisión