Partagez

Le ROBObook : l'algorithme crée du contenu

Fernand Léger, La Lecture, 1924, Centre Pompidou, Paris. Dans le tableau Léger, qui explore la relation homme-environnement dans le paysage mécanisé et automatisé, représente deux figures féminines monumentales, l'une nue et l'autre habillée, tenant des livres sans reposer leurs yeux qui regardent directement le spectateur.

Le ROBObook : l'algorithme crée du contenu

Comme le montre également l'assemblage anatomique, les figures ne semblent même pas "humaines", mais, dans leur représentation en couleurs froides sur un fond totalement astratto, apparaissent comme des appendices fonctionnels d'une puissante machine qui produisait également les trois improbables fleurs coupées tenues par le personnage de droite. Comme l'explique la fiche que le musée consacre à l'œuvre, La Cours magistral "c'est une des premières réalisations, sans doute la plus impressionnante, du principe de la figure objet" qui informe l'art du peintre normand.

Livres al vol

Imaginez vouloir lire sur n'importe quel sujet et à n'importe quel niveau de détail, les livres sont tous disponibles mais il n'y a toujours rien de réel, de tangible ; les mots, les milliers de mots qui composeront le livre restent inanimés et déconnectés dans une base de données jusqu'à ce que quelqu'un commande le livre à Amazon ou à une autre librairie. A ce moment-là, en très peu de temps, 20 minutes maximum, le livre sera prêt, généré à un coût très faible : celui du courant électrique utilisé pour faire fonctionner l'ordinateur…

L'idée de construire des livres à la volée vient de Philip M. Parker, professeur de marketing à la Business School insead. Parker a créé un logiciel capable d'écrire des livres sur des sujets spécifiques en 20 minutes environ.  L'algorithme breveté a jusqu'à présent généré des centaines de milliers de livres. En effet, Amazon répertorie plus de 100.000 700.000 livres attribués à Parker, et plus de XNUMX XNUMX ouvrages à sa société, la icône (sur le bord gauche de l'écran) Groupe International, Inc.

Parker n'est pas tant un auteur qu'un compilateur, mais le résultat final est le même : des livraisons pleines d'œuvres écrites. Peut-être que ces livres ne sont pas ceux que les gens lisent le plus souvent. En fait, les catégories les plus courantes concernent les rapports techniques et commerciaux, les dictionnaires de langues avec le pseudonyme "Webster» (qui est dans le domaine public), des synthèses sur les maladies rares et des livres de mots croisés pour l'apprentissage des langues étrangères. Mais ils ont tous un point commun : ils sont générés automatiquement par un logiciel. Le système automatise ce processus grâce à la construction de bases de données à partir desquelles, via une interface permettant d'en personnaliser une question, tirer des informations sur un certain sujet et générer des modèles.

Étant donné que ebook numérique et services impression-à la demande sont désormais à l'ordre du jour, les sujets sont tous répertoriés dans Amazon sans même avoir encore été écrits.

Voici comment un extrait du brevet de 2007 décrit le système : « Cette invention permet la création, la commercialisation et la distribution automatiques de contenus. Un ordinateur est l'auteur du contenu. Le matériel est automatiquement formaté dans un format souhaité pour générer un contenu. Le contenu peut également être automatiquement distribué au destinataire. [...] De plus, le titre peut être rédigé sur demande, dans n'importe quelle langue et avec un contenu actualisé».

La formule construire-CONTENUTO da question

Pour être clair, ce n'est pas seulement un logiciel, mais un véritable système automatique, conçu pour écrire sur un sujet précis. La base de données du système est remplie de contenu pertinent et de modèles spécifiques codés pour refléter les connaissances générales, c'est-à-dire le résultat tel qu'écrit par un expert dans cette industrie ou ce genre particulier. Pour prévenir la violation du droit d'auteur, le système est conçu pour éviter le plagiat. En fait, le brevet vise à créer des œuvres originales qui, cependant, ne doivent pas nécessairement être créatives. En d'autres termes, si n'importe quel type de contenu peut être décomposé en une formule, alors un nombre infini de contenus différents peuvent être empaquetés avec cette même formule.

Voici comment Parker décrit le processus de création de livre algorithmique.

Le succès (et le génie) de ce système est que Parker a conçu les algorithmes en simulant le processus mental qu'un expert devrait nécessairement faire pour écrire sur un certain sujet. Il s'agit « simplement » de déconstruire le contenu d'une catégorie, et Parker a une certaine expérience dans ce domaine, ayant écrit au moins trois livres à l'ancienne. Le fonctionnement de l'algorithme de création de contenu (dans la plupart des cas) permet de le coder en tant qu'intelligence artificielle.

Il catalogue è cette

Il est instructif de regarder un échantillon de la liste des livres attribués à Parker :

- Webster, Dictionnaire des synonymes slovaque-anglais, prix 28,95 $

- Les Perspectives mondiales 2007-2012 des sièges de toilette en bois, prix 795 $

- Le marché mondial des préservatifs en caoutchouc. Au Mondial 2007 Perspective Trade, prix 325 $

- Le syndrome de Ellis-van Creveld — Dictionnaire et bibliographie pour médecins, patients et chercheurs du Génome Une recherche, prix 28,95 $

- Webster, créole anglais-haïtien. Mots croisés : Niveau 1, prix 14.95 $

Considérant qu'il en coûte quelque chose comme 0,20 à 0,50 $ pour produire un titre (égal au coût de l'électricité et du matériel), les prix indiqués sont presque entièrement des revenus, même si se ils se vendent très peu d'exemplaires...

En réalité, de nombreux livres de non-fiction – comme des articles de presse – les sujets se résument souvent à des formules «qui, quoi, où, quand et pourquoi». Quelle que soit la manière dont les informations actuelles ou connexes sont présentées, il doit y avoir des données essentielles, même pour les sujets les moins familiers. Et Parker n'est pas le seul à automatiser le contenu. La startup de Chicago Narrative Science produit des articles d'actualité, sportifs et financiers pour Forbes depuis un moment déjà.

Donc, Quel est le prochain genre de livre que Parker ciblera pour un nouveau produit logiciel ? Des romans. Même si un roman est une œuvre de fiction, ce n'est un secret pour personne que certains genres, comme les romans d'amour, se prêtent également à la mathématisation. Cela ne rend peut-être pas ces œuvres importantes pour leur valeur littéraire, mais elles ont certainement une grande valeur de divertissement et, peut-être étonnamment, le genre romanesque détient la plus grande part du marché du livre avec des revenus d'environ 1,37 milliard de dollars en 2011.

Mais l'intelligence artificielle peut-elle faire un travail créatif comme un humain ? Oui… finalement. En fait, les questions à se poser sont : dans combien de temps cela arrivera-t-il ? Et quelle sera sa pertinence ? Les réponses sont peut-être déjà à l'horizon si Parker peut produire des romans qui seront lus par les masses. Franchement, toute œuvre de création produite par une IA sera un « succès » si vous la lisez et pensez qu'un être humain l'a écrite, ou plus exactement qu'une intelligence humaine est à l'origine de l'œuvre.

Parker envisage maintenant de créer une base de données de contenu qui va au-delà des livres et qu'il pourra utiliseret le même moteur que le ROBObook.

sur i livres

Mais les livres peuvent n'être qu'un début. Comme le note Parker dans son vidéo, les logiciels ne doivent pas se limiter aux seuls travaux écrits. À l'aide d'animations 3D et d'avatars, une grande variété de formats audio et vidéo peuvent être générés, ce qui, selon Parker, est en préparation. Les avatars qui lisent les nouvelles histoires élaborées par le logiciel pourraient devenir à la mode, surtout si les téléspectateurs peuvent les personnaliser et décider du niveau de détail.

La technologie de génération de contenu pourrait converger avec d'autres développements, tels que la création automatique de sous-titres codés pour étendre le contenu. La figure du traducteur deviendrait essentielle non seulement pour traduire des contenus déjà produits mais aussi audio et vidéo en temps réel. De plus, avec les blogs sociaux permettant aux gens de capter tout ce qui se dit ou se dit à leur sujet, ces données pourraient être utilisées pour construire de véritables biographies personnelles.

Enfin, si vous ajoutez des statistiques sur de grands nombres au mélange, vous pourriez avoir la possibilité de générer un contenu important, le tout réalisé par des ordinateurs spécialement conçus à cet effet.

L'avenir du contenu devient de plus en plus de la science-fiction, mais il faudra encore quelques années avant que sa création ne soit entièrement entre les mains du logiciel. Mais si vous avez des doutes sur où nous allons, considérez que le premier roman écrit par un ordinateur a déjà été publié il y a 7 ans.

Une nouvelle chaîne de montage ? Nous aussi nous finirons avalés par les algorithmes de Parker comme le pauvre Charlot par les engrenages de la machine-outil dans Les temps modernes?

Passez en revue