Data Inbreeding

Les spécialistes en LLM s’inquiètent. L’IA souffre de DI, c’est-à-dire de CN, de sorte que le MC parait inévitable. De fait, les GPT pourront accroitre leur F-Score (precision and recall formula), les RNN du DL se perfectionner davantage, la loop finira toujours par se louper. Pour s’en rendre compte (realize), il suffit de coupler un GPT-4V muni du prompt: «décris cette image» à un Dall-E3 soumis à l’input: «génère cette image». Mona Lisa se change bientôt en une boule abstraite de couleurs et de formes élémentaires. CQFD.

Malgré la merveilleuse aisance de cuistre spécialisé dont je viens de faire montre, vous avez pu sentir ma détestation des acronymes comme de toute autre fonctionnalisation de la parole. Il n’en demeure pas moins que je vais parler de ce qui s’appelle, dans cette langue qui n’est plus de Shakespeare, data inbreeding, et que l’on traduit par «consanguinité numérique» dans notre langue qui n’est plus de Molière.

Premier symptôme du phénomène: l’espèce de voile jaune, façon studio Ghibli, qui couvre les images générées par la prétendue intelligence artificielle, auquel répond la multiplication des applications conçues pour les «déjaunifier», c’est-à-dire contrecarrer cette anomalie. Car, sitôt que la baguette magique commet une bévue, une gomme magique se propose d’y remédier. Comme Mickey dans L’apprenti sorcier, on prétend s’en sortir par ce qui nous enfonce. L’IA corrigeant l’IA la redouble et ne parvient qu’à la déchainer.

C’est pire qu’embêtant. Ce qui nous embête, au moins, nous fait revenir à la bête ou à la bonne vieille bêtise. Ici, comment dire? C’est «embinarisant». L’intelligence artificielle ne peut être alimentée que par des données disponibles sur les réseaux numériques. Or, d’une part, ceux qui s’y déversent le plus sont des gens assez seuls, et donc plutôt névropathes. D’autre part, tout naturellement, pour ainsi dire, ce qui s’y trouve est de plus en plus produit par les robots, et c’est là qu’intervient la «consanguinité numérique» avec l’idée de dégénérescence qui s’y associe. Le serpent se mord la queue. L’expression quelque peu désuète et vulgaire de «masturbation mentale» s’applique avec une pertinence renouvelée à cet autoérotisme numérique.

Y a-t-il un moyen pour y parer? Ne pourrait-on pas créer des logiciels qui reconnaissent les données de première main et rejettent celles de dernière contrefaçon? En vérité, ces logiciels existent déjà, tout de suite absorbés par l’algorithme. Le propre de l’intelligence artificielle n’est-il pas de simuler l’intelligence véritable, et donc de faire illusion, de tromper autant que possible une autre intelligence artificielle?

Aussi les data scientists craignent-ils le model collapse – l’effondrement de leur système: une boulimie d’informations qui se change en autophagie. L’IA est nue. Elle montre ses bits (excusez le mauvais jeu de mots, je suis dada plus que data).

Moralité: l’innovation s’arrête si peu qu’elle finit par découvrir l’eau chaude. L’effondrement du modèle n’est rien d’autre que la redécouverte de l’intelligence en chair, en os et en esprit, et de son caractère particulièrement coriace.

Fabrice Hadjadj
Fabrice Hadjadj

Fabrice Hadjadj est philosophe et dramaturge. Il dirige l’Institut Philanthropos, à Fribourg, en Suisse.