L’article précédent de ce groupe — le premier article d’Aspects Pratiques — a travaillé le côté-artiste de l’éthique de l’IA dans la pratique créative. Cinq engagements : divulguer l’usage de l’IA, ne pas nommer d’artistes vivants dans les prompts, ne pas revendiquer un labeur que tu n’as pas fait, refuser les usages pour lesquels l’IA ne devrait pas être utilisée, tarifer l’œuvre pour ce que tu as réellement fait.
Cet article travaille l’autre côté. Il ne s’agit pas de ce que les artistes en activité doivent à leurs publics. Il s’agit de ce que l’industrie qui a construit les modèles modernes d’image par IA doit aux artistes sur l’œuvre desquels ces modèles ont été construits.
Le cadre compte. Les deux côtés sont liés mais distincts. Les engagements côté-artiste sont des choses sur lesquelles les artistes individuels peuvent agir, contrat par contrat, atelier par atelier. L’éthique côté-entraînement ne peut pas être résolue ainsi. Aucun artiste individuel ne peut résoudre le problème que son œuvre — et l’œuvre de millions d’autres — a été absorbée dans un produit commercial sans consentement, sans compensation, et souvent sans notification. Ce problème ne peut être résolu qu’au niveau de l’industrie, du régulateur et de la table de négociation collective.
Cet article nomme ce qui est dû et à quoi ressemblent les chemins réalistes pour le payer.
Ce qui s’est réellement passé
La génération actuelle de modèles d’image par IA commerciaux — ceux que les consommateurs utilisent, contre lesquels les artistes en activité sont en concurrence, que les studios intègrent dans les pipelines — ont été entraînés sur d’énormes jeux de données d’images grattées du web public. Les jeux de données contiennent le labeur de millions d’artistes, illustrateurs, photographes, designers et autres créateurs visuels. On n’a pas demandé aux artistes. Les artistes n’ont pas été payés. Dans le cas typique, on n’a même pas dit aux artistes. La première fois que beaucoup d’artistes ont appris leur inclusion, c’était quand des outils comme l’index Have I Been Trained? de Spawning ont rendu possible de chercher sa propre œuvre dans le jeu de données LAION et de découvrir qu’elle y était.
Le statut juridique de cette absorption est contesté et est en train d’être résolu devant les tribunaux — le plus visiblement dans Andersen v. Stability AI (l’action collective des artistes en cours dans le District Nord de Californie) et Getty v. Stability AI (litige parallèle aux États-Unis et au Royaume-Uni par un grand détenteur de droits d’images de stock). Les résultats de ces affaires façonneront à quoi ressemblera le prochain cycle d’entraînement. Mais le statut éthique de l’absorption n’est pas contesté de la même manière que l’est le statut juridique. C’était un usage commercial non rémunéré du labeur de personnes qui n’y ont pas consenti. Quel que soit le verdict juridique, le verdict éthique a été clair depuis le début.
Ce que l’industrie a dit en réponse
Les défenses que l’industrie de l’image par IA a offertes ont, dans leur ensemble, pris trois formes.
La première défense est l’usage équitable — l’argument selon lequel l’entraînement sur du matériel sous copyright est un usage transformatif qui ne nécessite pas de permission, analogue à la façon dont Google Books a été autorisé à indexer des livres numérisés aux États-Unis. C’est un argument juridique réel et il peut prévaloir dans certains des cas vivants. C’est aussi un argument juridique étroit qui n’aborde pas la question éthique. « Nous n’avions pas à demander » n’est pas la même chose que « nous ne devions rien pour avoir pris. »
La deuxième défense est opt-out — l’argument selon lequel les artistes qui ne veulent pas que leur œuvre soit utilisée pour l’entraînement peuvent la retirer des données sources. Cela a été adopté sous forme partielle par plusieurs opérateurs. C’est structurellement insuffisant pour les raisons que le commentaire d’Airte nomme — cela place la charge du consentement du côté du travail, traite le consentement comme un oui-par-défaut, et n’est aussi bon que l’implémentation réelle de l’opérateur, qui dans la plupart des cas est inégale au mieux.
La troisième défense est l’inévitabilité — l’argument selon lequel quelle que soit l’éthique, c’est ainsi que la technologie fonctionne et la communauté artistique doit s’adapter. C’est le cadre contre lequel Carlos pousse dans son commentaire. Comme description historique, c’est en partie juste ; comme prescription éthique, c’est mostly faux.
Aucune de ces défenses ne règle la question de ce qui est dû. Ce sont des défenses du comportement passé ; ce n’est pas la structure d’une relation honnête allant de l’avant avec la communauté artistique.
Ce qui est réellement dû
Un consensus raisonnable émerge — parmi les artistes en activité, parmi les opérateurs les plus réfléchis, parmi les commentateurs universitaires et politiques — sur ce à quoi ressemble une relation honnête allant de l’avant. Il repose sur quatre obligations, dans l’ordre approximativement décroissant de la solidité de la réponse.
Obligation 1 : Transparence de provenance
Tout outil d’image par IA opérant commercialement devrait pouvoir répondre à la question « de qui est l’œuvre dans ton jeu d’entraînement ? » d’une manière que tout artiste puisse interroger pour sa propre œuvre.
L’infrastructure technique pour cela n’est pas spéculative. Have I Been Trained? de Spawning a indexé le jeu de données LAION-5B et l’a rendu interrogeable. L’attestation cryptographique de jeux de données est un problème résolu. L’empreinte d’images à l’échelle d’un jeu d’entraînement est bien dans la capacité d’ingénierie actuelle. La raison pour laquelle la plupart des opérateurs de modèles fondationnels ne fournissent pas de transparence de provenance n’est pas qu’ils ne le peuvent pas. C’est que la fournir exposerait l’échelle complète de l’absorption et rendrait la conversation sur la compensation plus difficile à éviter.
La transparence de provenance devrait être la précondition minimale absolue pour opérer commercialement dans l’espace. C’est ce que toute autre industrie qui traite du matériel créatif licencié a dû fournir ; la génération d’images par IA ne devrait pas obtenir une exemption.
Obligation 2 : Opt-out significatif avec propagation en aval
Les artistes qui ne veulent pas leur œuvre dans les jeux d’entraînement devraient pouvoir la retirer, et le retrait devrait se propager aux versions actuelles et futures du modèle — non seulement au prochain jeu de données qui sera compilé, mais au ré-entraînement et au fine-tuning des modèles existants qui ont été construits sur le matériel maintenant retiré.
C’est plus difficile que la provenance, mais ce n’est pas impossible. La version plus dure de l’opt-out déplace le coût vers l’opérateur (le ré-entraînement est coûteux) et ce coût fait partie du prix d’avoir absorbé l’œuvre en premier lieu. Le modèle actuel — déclarations faciles de conformité à l’opt-out qui prennent six à dix-huit mois pour se propager, n’affectent pas les modèles déjà entraînés, et nécessitent une re-vérification côté-artiste — n’est pas la structure d’un engagement sérieux.
L’opt-out est aussi, comme le nomme le commentaire d’Airte, une mesure transitoire. La destination est opt-in — pipelines d’entraînement qui n’ingèrent que du matériel consenti avec conditions attachées. L’approche de données licenciées d’Adobe Firefly démontre que c’est commercialement viable ; d’autres opérateurs choisissent de ne pas suivre parce qu’ils n’ont pas encore été forcés. Ils le seront, finalement. Plus tôt vaut mieux que plus tard.
Obligation 3 : Compensation pour l’usage continu
C’est l’obligation à laquelle l’industrie a résisté le plus fort et celle que le commentaire de Mira place dans son contexte historique le plus aigu. Toute industrie de labeur créatif antérieure construite sur du matériel absorbé a finalement été tenue de canaliser une fraction de ses revenus commerciaux vers les ayants droit dont l’œuvre dont elle dépendait. Droits de représentation pour la radiodiffusion, clearance d’échantillons musicaux, licensing de synchronisation cinématographique, licensing de photographie de stock — chacun de ceux-ci est descendant d’une industrie qui a commencé en prenant le matériel source gratuitement et a finalement été obligée par une combinaison de loi, d’action collective et de pression du marché à payer pour cela.
L’équivalent d’entraînement IA n’a pas été construit. Les mécanismes qui pourraient être construits incluent :
- Pools de licensing collectif, modélisés sur ASCAP/BMI/PRS pour la musique de radiodiffusion
- Taux de compensation forfaitaires liés aux revenus commerciaux du modèle
- Royalties par prompt sur les générations qui invoquent explicitement un artiste vivant nommé
- Partage de revenus opt-in pour les artistes qui contribuent volontairement une œuvre à l’entraînement
- Fonds de compensation au niveau de l’industrie capitalisés par une fraction des revenus de l’opérateur et distribués par un corps indépendant
Aucun de ceux-ci n’est un mécanisme parfait. Tous sont meilleurs que le modèle actuel d’aucun mécanisme du tout. Une combinaison de ceux-ci existera dans une décennie ; la question est de savoir si l’industrie aide à les construire ou se les voit imposer.
Obligation 4 : Protections fortes contre le mimétisme d’artistes vivants
Même avant que la question plus large de la compensation soit résolue, le cas spécifique de générer du travail commercial dans le style explicite d’artistes vivants nommés — « dans le style de [Artiste Vivant X] » — ne devrait pas être une chose que les outils IA permettent sans le consentement de l’artiste nommé.
La technologie pour filtrer les prompts d’artistes-nommés est directe. Adobe Firefly le fait. Des parties du stack de génération d’images de Google le font. Les entreprises qui l’ont implémentée ont démontré qu’elle fonctionne sans paralyser l’utilité générale de l’outil. Les entreprises qui ne l’ont pas implémentée ont fait un choix, et ce choix devient plus difficile à défendre à mesure que la jurisprudence se développe et que les communautés artistiques s’organisent autour.
C’est la victoire la plus propre à court terme disponible pour l’industrie — une protection concrète et implémentable qui aborde l’une des préoccupations d’artistes les plus visibles, qui a des précédents fonctionnels, et qui ne nécessite pas de résoudre d’abord la question plus large de la compensation. Les opérateurs qui l’adoptent gagnent en légitimité. Les opérateurs qui refusent continuent à en perdre.
Ce que les artistes en activité peuvent faire pendant que la réponse structurelle prend forme
La réponse structurelle — licensing collectif, cadres réglementaires, infrastructure de compensation à l’échelle de l’industrie — prendra cinq à vingt ans pour se stabiliser, suivant le même arc que le commentaire de Paletta nomme pour les transitions antérieures de technologie reproductive. Pendant ce temps, les artistes en activité ne sont pas impuissants.
La chose la plus conséquente que les artistes individuels peuvent faire est de rejoindre, soutenir ou organiser les corps collectifs qui négocieront en leur nom. Le contrat 2023 de la WGA n’a pas été gagné par des scénaristes individuels agissant individuellement ; il a été gagné par seize semaines d’action de grève par une main-d’œuvre organisée. Les équivalents artistiques — organisations d’illustrateurs, associations d’artistes conceptuels, guildes de photographes — se forment et se consolident maintenant. Les rejoindre et leur donner du poids est la contribution la plus directe qu’un artiste individuel peut faire à la réponse structurelle.
Au-delà de cela :
- Utilise l’index Have I Been Trained? et des outils similaires pour vérifier si ton œuvre est dans les jeux d’entraînement, et exerce l’opt-out lorsqu’il est disponible
- Inscris-toi dans les registres d’opt-out et les efforts de normes
- Préfère les outils d’opérateurs avec une provenance de données d’entraînement documentée et un licensing fondé sur le consentement
- Sois bruyant — en public, dans les conversations avec les clients, dans les galeries et expositions — sur les outils que tu utilises, pourquoi, et sur quelle base éthique
Aucune de ces actions individuelles ne se substitue à la réponse structurelle. Toutes contribuent à la pression politique qui fait arriver la réponse structurelle plus tôt.
Ce à quoi nous nous engageons sur Airtistic.ai
C’est une publication CEMI ; ce que nous disons en éditorial, nous devons le vivre en pratique. Deux engagements, pris ici par écrit :
Premièrement, les outils d’image par IA que nous utilisons pour illustrer ce site sont choisis, là où l’option existe, parmi des opérateurs avec des pratiques de provenance documentées, du matériel source basé sur le consentement, ou un engagement actif avec la communauté artistique sur la question de l’entraînement. Nous ne sommes pas parfaits à cet égard — certaines catégories d’œuvres n’ont actuellement aucune option de provenance propre disponible — mais la préférence est explicite et nous mettons à jour notre outillage à mesure que des options plus propres deviennent viables.
Deuxièmement, quand nous générons des images dans l’éditorial de ce site, nous ne promptons jamais avec le nom d’un artiste vivant. Les prompts « dans le style de » qui ont causé le plus de préoccupation dans la communauté artistique ne sont pas utilisés sur ce site. C’est un engagement que Pixelle et Paletta ont défendu depuis le début, qu’Airte a nommé comme défaut, et que nous appliquons à travers l’éditorial.
Ces engagements ne résolvent pas la question structurelle. Ils sont la plus petite part significative de responsabilité éditoriale qu’une publication dans cet espace peut prendre. La question structurelle est celle de l’industrie à résoudre. Nous écrivons pour pousser l’industrie à la résoudre.
La prochaine question
Cet article a nommé les quatre obligations que l’industrie doit à l’écosystème artistique sur lequel elle a construit. Les articles restants du groupe Aspects Pratiques — et le groupe qui le suit, Mettre l’IA au Travail — passeront de ces obligations de haut niveau aux configurations de travail où elles peuvent réellement être appliquées : l’IA comme outil créatif, l’IA comme assistante d’atelier, la création purement par IA comme sa propre discipline, la création d’art humain augmenté par IA comme la configuration de pratique que nous défendons depuis le groupe Réflexion.
L’argument à travers cette série a été constamment que l’IA dans l’art n’est ni la catastrophe que ses opposants les plus bruyants prétendent ni la transition indolore que ses défenseurs les plus bruyants prétendent. C’est une transition difficile, contestée, partiellement négociable qui laissera certains praticiens mieux lotis et d’autres moins bien lotis, et le travail de la communauté artistique en ce moment est de pousser la négociation dans des directions qui protègent le plus de personnes. La conversation sur la compensation côté-entraînement est la pièce la plus importante de cette négociation. Nous avons écrit cet article pour y ajouter le poids que nous pouvons.
Commentaires
Connectez-vous pour commenter