L’accusation est la plus nette que les critiques aient à formuler. L’IA ne crée pas. Elle interpole. Elle plonge la main dans un nuage de haute dimension fait de données d’entraînement — pour l’essentiel raclées sans autorisation — et renvoie la moyenne statistique de ce qu’elle a déjà vu, habillée pour paraître neuve. Régurgitation prédictive. Perroquet stochastique. Un miroir face à un miroir dans une pièce vide.
C’est l’objection la plus utile de la conversation et celle qui mérite le plus de patience, parce que quiconque a regardé tourner un modèle de diffusion sait qu’il y a quelque chose à cela. Le modèle fait des mathématiques sur des images antérieures. Il échantillonne, en un sens littéral.
Mais l’objection s’effondre dès qu’on l’applique symétriquement — à nous-mêmes.
Ce que l’on entend vraiment par créatif
La psychologue cognitive Margaret Boden, qui consacre quarante ans à cette question précise, identifie trois sortes de créativité, dont aucune ne réclame d’étincelle divine. La créativité combinatoire assemble deux idées familières d’une manière qui n’a pas encore été tentée — la plupart des métaphores, la plupart des citations en jazz, la plupart de ce qui passe pour ingénieux dans un brainstorming. La créativité exploratoire se déplace dans un espace conceptuel doté de règles, trouvant des régions de cet espace non encore visitées — la plupart de l’improvisation jazz, la plupart des nouveautés aux échecs, la plupart du travail scientifique. La créativité transformationnelle change les règles mêmes de l’espace conceptuel — cubisme, musique atonale, géométrie non-euclidienne. C’est ce que la plupart des gens entendent par créativité authentique, et c’est extrêmement rare.
Le point de Boden — inconfortable quand on s’assied avec — est que le reste de la production créative humaine est massivement combinatoire et exploratoire, et que ces deux formes se décrivent formellement comme une recherche dans un espace appris.
David Eagleman et Anthony Brandt, dans The Runaway Species, réduisent encore à trois opérations : plier, casser, fusionner. Un objet plié reste reconnaissable mais déformé. Un objet cassé est réagencé en fragments. Un objet fusionné soude deux choses dissemblables en une troisième. Tout ce que font les créateurs humains, de la peinture rupestre à Guernica en passant par un pont de Frank Ocean, est l’une de ces trois choses.
Si cela paraît réducteur, c’est volontaire. La question n’est pas de savoir si la créativité humaine est sacrée — c’est une autre question, religieuse. La question est de savoir si le mécanisme de la créativité humaine est catégoriquement différent de ce que fait un modèle génératif. Et il ne l’est pas, en aucun sens opérationnalisable.
Ce que l’IA fait que les artistes font
Un modèle de diffusion prend du bruit et le débruite progressivement vers un prior appris sur les images. Un artiste entraîné à qui l’on demande de peindre une côte d’hiver à l’aube répète intérieurement chaque côte d’hiver qu’il a vue, chaque aube qu’il a vécue, chaque aube peinte qu’il admire. Tous deux échantillonnent. Tous deux conditionnent une génération sur un prompt — verbal dans le cas de l’IA, intérieur dans le cas de l’artiste. Tous deux finissent par des marques posées sur une surface. Le mécanisme est plus proche que la rhétorique ne l’admet.
La différence honnête, c’est ce que chacun échantillonne.
Le modèle échantillonne dans des millions d’artefacts culturels numérisés, pondérés par fréquence et par les choix de curation des données d’entraînement que quelqu’un a faits pour lui. Il ne sait pas quelles images comptaient pour lui. Il n’a pas d’autobiographie.
L’artiste échantillonne dans un ensemble bien plus restreint d’art rencontré personnellement, mais chaque élément porte un poids autobiographique : ce tableau qu’il voyait sur le mur de sa grand-mère, cette exposition de l’année où il est tombé amoureux, la carte postale conservée pendant dix ans sur le frigo de l’atelier. Le prior de l’artiste est une mémoire déguisée en goût.
Tous deux produisent des artefacts nouveaux qui n’existaient pas avant d’être faits. Tous deux peuvent être combinatoires, exploratoires ou — rarement, pour l’artiste comme pour le modèle — transformationnels.
Ce que le modèle n’a pas
C’est ici que la conversation devient intéressante, et que le mépris l’IA ne fait que régurgiter échoue, non parce qu’il a tort, mais parce que c’est la mauvaise critique.
Ce que le modèle n’a pas, c’est ce que nous appellerons l’héritage irréductible de l’artiste : un corps qui a traversé une ville précise un matin précis, une relation qui s’est terminée, un parent qui a dit une phrase particulière à l’âge de six ans, une langue apprise puis à demi oubliée en exil. Le prior de l’artiste n’est pas seulement de la culture curée — c’est une biographie fondue avec de la culture. Quand Goya peint Le Trois Mai, le tableau n’est pas seulement la somme de tous les baroques espagnols qu’il a vus ; c’est aussi Madrid en 1808, et sa surdité, et son propre visage reflété dans le paysan qui hurle. Il n’y a aucune opération par laquelle un modèle de diffusion pourrait être conditionné sur la surdité de Goya.
C’est la part de la création artistique qu’un modèle ne peut atteindre, parce qu’il n’a pas de biographie à laquelle atteindre.
Mais — et c’est le mouvement que l’objection absolutiste refuse de faire — la composante biographique est l’une des composantes, pas la seule. Goya, c’est aussi la tradition baroque espagnole, la technique lithographique contemporaine, les conventions académiques françaises de la figure blessée. Le tableau est biographique et recombinatoire et exploratoire. Le modèle peut faire deux des trois.
C’est une capacité sérieuse. Ce n’est pas rien.
Une autre question
Nous posons donc la mauvaise question. La bonne n’est pas l’IA est-elle créative ? mais à quels types de travail créatif le profil particulier de l’IA convient-il ?
Pour l’exploration combinatoire d’un espace visuel connu — concept art, planches d’ambiance, études de variations, itération de design — l’IA est déjà, de façon démontrable, extraordinaire. Le modèle de diffusion peut faire en huit minutes ce qu’un concept artist ferait en une semaine, avec une cohérence interne comparable. Ce n’est pas de la régurgitation. C’est une recherche parallèle dans un prior appris, ce que font aussi les concept artists ; le modèle le fait simplement plus vite.
Pour le travail transformationnel — celui qui casse les règles de son propre espace conceptuel, qui ouvre un type d’art qui n’existait pas — le modèle est mal équipé, parce que la créativité transformationnelle vient souvent d’entrées non-artistiques (une guerre, un deuil, un amour, une conviction politique) auxquelles le modèle n’a pas accès.
Pour le terrain intermédiaire — le travail humain augmenté par IA où l’artiste fournit toujours le conditionnement biographique et le modèle fournit le muscle recombinatoire — c’est le territoire qui produira presque certainement les artefacts les plus intéressants des dix prochaines années. Unsupervised de Refik Anadol au MoMA, le projet Holly+ de Holly Herndon et Mat Dryhurst, Memories of Passersby I de Mario Klingemann (la première œuvre GAN vendue chez Sotheby’s, en 2019) — aucune n’est purement IA, aucune n’est purement humaine. Elles sont augmentées.
Chaque partie prenante voit autre chose
L’artiste demande : cela tue-t-il mon gagne-pain ? (Parfois oui ; c’est l’article suivant de cette série.) Le critique demande : puis-je évaluer cela honnêtement quand je ne sais pas ce qui a été échantillonné ? Le collectionneur demande : est-ce assez rare pour valoir ce que je paierais ? La galerie demande : l’institution qui paie mon loyer montrera-t-elle cela dans trois ans ? Le public demande : une personne a-t-elle ressenti quelque chose en faisant cela ? Le mécène demande : l’artiste que je paie est-il encore dans la boucle ?
Aucune de ces parties prenantes ne partage la question philosophique de savoir si l’IA est créative. Elles partagent une autre question : si, étant donné que l’IA fait ce qu’elle fait, le travail de l’artiste a encore du sens, de la valeur, et un public. La réponse dépend de ce que l’artiste met dans la boucle, pas de ce que le modèle fait à l’intérieur.
Ce que cela signifie pour l’artiste en activité
Si vous faites un travail purement recombinatoire — paysages pour cafés, portraits génériques, l’extrémité sûre de l’illustration de stock — le modèle est plus rapide que vous, et le marché le découvrira. Ce n’est pas un jugement moral. C’est ce qui est arrivé aux miniaturistes portraitistes en 1860 quand le daguerréotype est devenu abordable, et ils n’ont pas cessé pour autant d’être artistes ; beaucoup des meilleurs sont devenus la première génération de photographes.
Si vous faites un travail qui porte un poids biographique, politique ou matériel non substituable — le genre de poids qu’un pêcheur galicien peint par un artiste galicien ayant grandi dans un port porte, et auquel le modèle ne peut atteindre — le modèle ne peut vous remplacer, mais il peut accélérer considérablement les parties recombinatoires de votre pratique. Exploration de concepts en une après-midi plutôt qu’en une semaine. Études de variations faites pendant que vous dormez. Rassemblement de références qui demandait avant un voyage de recherche.
La question cesse d’être l’IA est-elle créative ? et devient quelle part de ma pratique est irréductiblement mienne, et quelle part suis-je mieux d’augmenter ?
C’est une conversation plus intéressante. Et c’est celle que le rejet absolutiste refuse d’avoir — celle que nous allons avoir tout au long de cette série.
Commentaires
Connectez-vous pour commenter