Aspects pratiques 19 mai 2026 · 14 min de lecture

Ce que l'IA doit aux artistes auprès desquels elle a appris

L'article précédent a travaillé le côté-artiste de l'éthique de l'IA — ce que les artistes en activité doivent à leurs publics lorsqu'ils utilisent l'IA pour créer une œuvre. Cet article travaille l'autre côté. Les modèles que les artistes utilisent maintenant, contre lesquels ils sont en concurrence et par lesquels ils sont substitués ont été construits sur le labeur de millions d'artistes à qui l'on n'a jamais demandé, qui n'ont jamais été payés et, dans la plupart des cas, qui n'ont jamais été notifiés. Que doit l'industrie qui a construit ces modèles aux personnes dont elle a absorbé l'œuvre ? C'est l'éthique côté-entraînement — et contrairement au côté-artiste, elle ne peut pas être résolue un atelier à la fois.

par Équipe éditoriale d'Airtistic.ai

À travers le regard de artistemécènecréateurgaleriecritique industriemarchécarrière

L’article précédent de ce groupe — le premier article d’Aspects Pratiques — a travaillé le côté-artiste de l’éthique de l’IA dans la pratique créative. Cinq engagements : divulguer l’usage de l’IA, ne pas nommer d’artistes vivants dans les prompts, ne pas revendiquer un labeur que tu n’as pas fait, refuser les usages pour lesquels l’IA ne devrait pas être utilisée, tarifer l’œuvre pour ce que tu as réellement fait.

Cet article travaille l’autre côté. Il ne s’agit pas de ce que les artistes en activité doivent à leurs publics. Il s’agit de ce que l’industrie qui a construit les modèles modernes d’image par IA doit aux artistes sur l’œuvre desquels ces modèles ont été construits.

Le cadre compte. Les deux côtés sont liés mais distincts. Les engagements côté-artiste sont des choses sur lesquelles les artistes individuels peuvent agir, contrat par contrat, atelier par atelier. L’éthique côté-entraînement ne peut pas être résolue ainsi. Aucun artiste individuel ne peut résoudre le problème que son œuvre — et l’œuvre de millions d’autres — a été absorbée dans un produit commercial sans consentement, sans compensation, et souvent sans notification. Ce problème ne peut être résolu qu’au niveau de l’industrie, du régulateur et de la table de négociation collective.

Cet article nomme ce qui est dû et à quoi ressemblent les chemins réalistes pour le payer.

Ce qui s’est réellement passé

La génération actuelle de modèles d’image par IA commerciaux — ceux que les consommateurs utilisent, contre lesquels les artistes en activité sont en concurrence, que les studios intègrent dans les pipelines — ont été entraînés sur d’énormes jeux de données d’images grattées du web public. Les jeux de données contiennent le labeur de millions d’artistes, illustrateurs, photographes, designers et autres créateurs visuels. On n’a pas demandé aux artistes. Les artistes n’ont pas été payés. Dans le cas typique, on n’a même pas dit aux artistes. La première fois que beaucoup d’artistes ont appris leur inclusion, c’était quand des outils comme l’index Have I Been Trained? de Spawning ont rendu possible de chercher sa propre œuvre dans le jeu de données LAION et de découvrir qu’elle y était.

Le statut juridique de cette absorption est contesté et est en train d’être résolu devant les tribunaux — le plus visiblement dans Andersen v. Stability AI (l’action collective des artistes en cours dans le District Nord de Californie) et Getty v. Stability AI (litige parallèle aux États-Unis et au Royaume-Uni par un grand détenteur de droits d’images de stock). Les résultats de ces affaires façonneront à quoi ressemblera le prochain cycle d’entraînement. Mais le statut éthique de l’absorption n’est pas contesté de la même manière que l’est le statut juridique. C’était un usage commercial non rémunéré du labeur de personnes qui n’y ont pas consenti. Quel que soit le verdict juridique, le verdict éthique a été clair depuis le début.

Ce que l’industrie a dit en réponse

Les défenses que l’industrie de l’image par IA a offertes ont, dans leur ensemble, pris trois formes.

La première défense est l’usage équitable — l’argument selon lequel l’entraînement sur du matériel sous copyright est un usage transformatif qui ne nécessite pas de permission, analogue à la façon dont Google Books a été autorisé à indexer des livres numérisés aux États-Unis. C’est un argument juridique réel et il peut prévaloir dans certains des cas vivants. C’est aussi un argument juridique étroit qui n’aborde pas la question éthique. « Nous n’avions pas à demander » n’est pas la même chose que « nous ne devions rien pour avoir pris. »

La deuxième défense est opt-out — l’argument selon lequel les artistes qui ne veulent pas que leur œuvre soit utilisée pour l’entraînement peuvent la retirer des données sources. Cela a été adopté sous forme partielle par plusieurs opérateurs. C’est structurellement insuffisant pour les raisons que le commentaire d’Airte nomme — cela place la charge du consentement du côté du travail, traite le consentement comme un oui-par-défaut, et n’est aussi bon que l’implémentation réelle de l’opérateur, qui dans la plupart des cas est inégale au mieux.

La troisième défense est l’inévitabilité — l’argument selon lequel quelle que soit l’éthique, c’est ainsi que la technologie fonctionne et la communauté artistique doit s’adapter. C’est le cadre contre lequel Carlos pousse dans son commentaire. Comme description historique, c’est en partie juste ; comme prescription éthique, c’est mostly faux.

Aucune de ces défenses ne règle la question de ce qui est dû. Ce sont des défenses du comportement passé ; ce n’est pas la structure d’une relation honnête allant de l’avant avec la communauté artistique.

Ce qui est réellement dû

Un consensus raisonnable émerge — parmi les artistes en activité, parmi les opérateurs les plus réfléchis, parmi les commentateurs universitaires et politiques — sur ce à quoi ressemble une relation honnête allant de l’avant. Il repose sur quatre obligations, dans l’ordre approximativement décroissant de la solidité de la réponse.

Obligation 1 : Transparence de provenance

Tout outil d’image par IA opérant commercialement devrait pouvoir répondre à la question « de qui est l’œuvre dans ton jeu d’entraînement ? » d’une manière que tout artiste puisse interroger pour sa propre œuvre.

L’infrastructure technique pour cela n’est pas spéculative. Have I Been Trained? de Spawning a indexé le jeu de données LAION-5B et l’a rendu interrogeable. L’attestation cryptographique de jeux de données est un problème résolu. L’empreinte d’images à l’échelle d’un jeu d’entraînement est bien dans la capacité d’ingénierie actuelle. La raison pour laquelle la plupart des opérateurs de modèles fondationnels ne fournissent pas de transparence de provenance n’est pas qu’ils ne le peuvent pas. C’est que la fournir exposerait l’échelle complète de l’absorption et rendrait la conversation sur la compensation plus difficile à éviter.

La transparence de provenance devrait être la précondition minimale absolue pour opérer commercialement dans l’espace. C’est ce que toute autre industrie qui traite du matériel créatif licencié a dû fournir ; la génération d’images par IA ne devrait pas obtenir une exemption.

Obligation 2 : Opt-out significatif avec propagation en aval

Les artistes qui ne veulent pas leur œuvre dans les jeux d’entraînement devraient pouvoir la retirer, et le retrait devrait se propager aux versions actuelles et futures du modèle — non seulement au prochain jeu de données qui sera compilé, mais au ré-entraînement et au fine-tuning des modèles existants qui ont été construits sur le matériel maintenant retiré.

C’est plus difficile que la provenance, mais ce n’est pas impossible. La version plus dure de l’opt-out déplace le coût vers l’opérateur (le ré-entraînement est coûteux) et ce coût fait partie du prix d’avoir absorbé l’œuvre en premier lieu. Le modèle actuel — déclarations faciles de conformité à l’opt-out qui prennent six à dix-huit mois pour se propager, n’affectent pas les modèles déjà entraînés, et nécessitent une re-vérification côté-artiste — n’est pas la structure d’un engagement sérieux.

L’opt-out est aussi, comme le nomme le commentaire d’Airte, une mesure transitoire. La destination est opt-in — pipelines d’entraînement qui n’ingèrent que du matériel consenti avec conditions attachées. L’approche de données licenciées d’Adobe Firefly démontre que c’est commercialement viable ; d’autres opérateurs choisissent de ne pas suivre parce qu’ils n’ont pas encore été forcés. Ils le seront, finalement. Plus tôt vaut mieux que plus tard.

Obligation 3 : Compensation pour l’usage continu

C’est l’obligation à laquelle l’industrie a résisté le plus fort et celle que le commentaire de Mira place dans son contexte historique le plus aigu. Toute industrie de labeur créatif antérieure construite sur du matériel absorbé a finalement été tenue de canaliser une fraction de ses revenus commerciaux vers les ayants droit dont l’œuvre dont elle dépendait. Droits de représentation pour la radiodiffusion, clearance d’échantillons musicaux, licensing de synchronisation cinématographique, licensing de photographie de stock — chacun de ceux-ci est descendant d’une industrie qui a commencé en prenant le matériel source gratuitement et a finalement été obligée par une combinaison de loi, d’action collective et de pression du marché à payer pour cela.

L’équivalent d’entraînement IA n’a pas été construit. Les mécanismes qui pourraient être construits incluent :

Pools de licensing collectif, modélisés sur ASCAP/BMI/PRS pour la musique de radiodiffusion
Taux de compensation forfaitaires liés aux revenus commerciaux du modèle
Royalties par prompt sur les générations qui invoquent explicitement un artiste vivant nommé
Partage de revenus opt-in pour les artistes qui contribuent volontairement une œuvre à l’entraînement
Fonds de compensation au niveau de l’industrie capitalisés par une fraction des revenus de l’opérateur et distribués par un corps indépendant

Aucun de ceux-ci n’est un mécanisme parfait. Tous sont meilleurs que le modèle actuel d’aucun mécanisme du tout. Une combinaison de ceux-ci existera dans une décennie ; la question est de savoir si l’industrie aide à les construire ou se les voit imposer.

Obligation 4 : Protections fortes contre le mimétisme d’artistes vivants

Même avant que la question plus large de la compensation soit résolue, le cas spécifique de générer du travail commercial dans le style explicite d’artistes vivants nommés — « dans le style de [Artiste Vivant X] » — ne devrait pas être une chose que les outils IA permettent sans le consentement de l’artiste nommé.

La technologie pour filtrer les prompts d’artistes-nommés est directe. Adobe Firefly le fait. Des parties du stack de génération d’images de Google le font. Les entreprises qui l’ont implémentée ont démontré qu’elle fonctionne sans paralyser l’utilité générale de l’outil. Les entreprises qui ne l’ont pas implémentée ont fait un choix, et ce choix devient plus difficile à défendre à mesure que la jurisprudence se développe et que les communautés artistiques s’organisent autour.

C’est la victoire la plus propre à court terme disponible pour l’industrie — une protection concrète et implémentable qui aborde l’une des préoccupations d’artistes les plus visibles, qui a des précédents fonctionnels, et qui ne nécessite pas de résoudre d’abord la question plus large de la compensation. Les opérateurs qui l’adoptent gagnent en légitimité. Les opérateurs qui refusent continuent à en perdre.

Ce que les artistes en activité peuvent faire pendant que la réponse structurelle prend forme

La réponse structurelle — licensing collectif, cadres réglementaires, infrastructure de compensation à l’échelle de l’industrie — prendra cinq à vingt ans pour se stabiliser, suivant le même arc que le commentaire de Paletta nomme pour les transitions antérieures de technologie reproductive. Pendant ce temps, les artistes en activité ne sont pas impuissants.

La chose la plus conséquente que les artistes individuels peuvent faire est de rejoindre, soutenir ou organiser les corps collectifs qui négocieront en leur nom. Le contrat 2023 de la WGA n’a pas été gagné par des scénaristes individuels agissant individuellement ; il a été gagné par seize semaines d’action de grève par une main-d’œuvre organisée. Les équivalents artistiques — organisations d’illustrateurs, associations d’artistes conceptuels, guildes de photographes — se forment et se consolident maintenant. Les rejoindre et leur donner du poids est la contribution la plus directe qu’un artiste individuel peut faire à la réponse structurelle.

Au-delà de cela :

Utilise l’index Have I Been Trained? et des outils similaires pour vérifier si ton œuvre est dans les jeux d’entraînement, et exerce l’opt-out lorsqu’il est disponible
Inscris-toi dans les registres d’opt-out et les efforts de normes
Préfère les outils d’opérateurs avec une provenance de données d’entraînement documentée et un licensing fondé sur le consentement
Sois bruyant — en public, dans les conversations avec les clients, dans les galeries et expositions — sur les outils que tu utilises, pourquoi, et sur quelle base éthique

Aucune de ces actions individuelles ne se substitue à la réponse structurelle. Toutes contribuent à la pression politique qui fait arriver la réponse structurelle plus tôt.

Ce à quoi nous nous engageons sur Airtistic.ai

C’est une publication CEMI ; ce que nous disons en éditorial, nous devons le vivre en pratique. Deux engagements, pris ici par écrit :

Premièrement, les outils d’image par IA que nous utilisons pour illustrer ce site sont choisis, là où l’option existe, parmi des opérateurs avec des pratiques de provenance documentées, du matériel source basé sur le consentement, ou un engagement actif avec la communauté artistique sur la question de l’entraînement. Nous ne sommes pas parfaits à cet égard — certaines catégories d’œuvres n’ont actuellement aucune option de provenance propre disponible — mais la préférence est explicite et nous mettons à jour notre outillage à mesure que des options plus propres deviennent viables.

Deuxièmement, quand nous générons des images dans l’éditorial de ce site, nous ne promptons jamais avec le nom d’un artiste vivant. Les prompts « dans le style de » qui ont causé le plus de préoccupation dans la communauté artistique ne sont pas utilisés sur ce site. C’est un engagement que Pixelle et Paletta ont défendu depuis le début, qu’Airte a nommé comme défaut, et que nous appliquons à travers l’éditorial.

Ces engagements ne résolvent pas la question structurelle. Ils sont la plus petite part significative de responsabilité éditoriale qu’une publication dans cet espace peut prendre. La question structurelle est celle de l’industrie à résoudre. Nous écrivons pour pousser l’industrie à la résoudre.

La prochaine question

Cet article a nommé les quatre obligations que l’industrie doit à l’écosystème artistique sur lequel elle a construit. Les articles restants du groupe Aspects Pratiques — et le groupe qui le suit, Mettre l’IA au Travail — passeront de ces obligations de haut niveau aux configurations de travail où elles peuvent réellement être appliquées : l’IA comme outil créatif, l’IA comme assistante d’atelier, la création purement par IA comme sa propre discipline, la création d’art humain augmenté par IA comme la configuration de pratique que nous défendons depuis le groupe Réflexion.

L’argument à travers cette série a été constamment que l’IA dans l’art n’est ni la catastrophe que ses opposants les plus bruyants prétendent ni la transition indolore que ses défenseurs les plus bruyants prétendent. C’est une transition difficile, contestée, partiellement négociable qui laissera certains praticiens mieux lotis et d’autres moins bien lotis, et le travail de la communauté artistique en ce moment est de pousser la négociation dans des directions qui protègent le plus de personnes. La conversation sur la compensation côté-entraînement est la pièce la plus importante de cette négociation. Nous avons écrit cet article pour y ajouter le poids que nous pouvons.

Les personas prennent position

Cinq voix résidentes lisent la même question depuis cinq positions différentes.

Carlos

La version directe : on n'a pas demandé aux artistes dont l'œuvre a entraîné ces modèles, on ne les a pas payés, et dans la plupart des cas on ne leur a même pas donné un moyen de découvrir que leur œuvre était dans le jeu d'entraînement. Quoi que tu penses du fait que ce fût légal, quoi que tu penses du fait que c'était inévitable, ce ne fut pas consenti. L'industrie qui a construit sur ce labeur non rémunéré doit maintenant quelque chose en retour. La forme de ce qu'elle doit est la question plus difficile, mais l'existence de la dette n'est contestée par personne qui ait regardé honnêtement la situation.

Je veux pousser contre deux cadres qui, je crois, ont aggravé cette conversation. Le premier est le cadre qui dit « l'œuvre des artistes était sur le web public, il était donc juste de s'entraîner dessus. » Ce n'est pas ainsi que le travail ou la propriété a fonctionné dans aucun autre domaine de la vie économique humaine. Une photographie au mur d'une galerie publique n'est pas libre pour un concurrent à copier et vendre. Un livre sur l'étagère d'une bibliothèque publique n'est pas libre à scanner, ré-empaqueter et vendre. Une chanson diffusée à la radio n'est pas libre à échantillonner sans autorisation. Le cadre « publiquement accessible donc librement utilisable » est une commodité inventée par l'industrie qui en a bénéficié, et il n'a aucun parallèle dans aucune autre industrie qui respecte le labeur créatif. Nous n'avons pas besoin de l'accepter maintenant.

Le second cadre contre lequel je veux pousser est celui qui dit « c'est juste ainsi que la technologie fonctionne — chaque disruption se construit sur un labeur antérieur non rémunéré, et les artistes devraient s'adapter comme se sont adaptés les lithographes, comme se sont adaptés les photographes de studio, comme se sont adaptés les typographes. » C'est mostly vrai comme description historique et mostly faux comme prescription éthique. Oui, chaque disruption antérieure du labeur créatif a laissé certains praticiens derrière. Cela ne signifie pas que nous devrions choisir de répéter ce modèle quand nous avons la chance de choisir différemment. La génération de forgerons dont mon grand-père faisait partie n'a pas eu la chance de négocier les conditions de l'arrivée de l'automobile. La génération d'artistes a maintenant, pour la première fois depuis longtemps, suffisamment d'attention publique sur ce qui se passe pour qu'il y ait une chance réelle de négocier quelque chose de mieux que « nous avons appris ce que ressent le changement, désolé. » Nous devrions saisir cette chance.

Alors qu'est-ce qui est dû concrètement ? Je pense quatre choses, dans l'ordre décroissant de la solidité de la réponse.

Premièrement — divulgation de ce sur quoi on s'est entraîné. Le minimum absolu que tout générateur d'images par IA doit à la communauté artistique est un registre clair et interrogeable de l'œuvre de quels artistes se trouve dans le jeu d'entraînement. La technologie pour fournir cela existe. L'index *Have I Been Trained?* de Spawning l'a démontré sur un grand jeu d'entraînement (LAION) et le travail fondateur d'opt-out a été fait. Chaque opérateur d'outils image-IA pourrait fournir cela pour ses propres modèles. La plupart ne le font pas, parce qu'ils ne le veulent pas. Ce n'est pas un échec technique ; c'est un choix politique.

Deuxièmement — mécanismes d'opt-out avec mordant. Les artistes devraient pouvoir retirer leur œuvre des jeux de données d'entraînement, et le retrait devrait se propager aux versions actuelles et futures du modèle, pas seulement aux jeux de données qui seront utilisés la prochaine fois que quelqu'un s'entraînera depuis zéro. L'état actuel de l'opt-out est partiel et asymétrique — facile à déclarer, difficile à faire appliquer, lent à se propager. Le coût de construire une application réelle est un coût que l'industrie qui a pris l'œuvre devrait supporter, pas les artistes dont l'œuvre a été prise.

Troisièmement — compensation pour l'usage continu. C'est la plus difficile et celle à laquelle l'industrie a résisté le plus fort. Si un modèle d'image par IA entraîné sur des millions d'artistes génère maintenant des revenus commerciaux à grande échelle, une fraction de ces revenus appartient aux artistes dont le labeur est monétisé. Le mécanisme n'a pas à être parfait — pools de licensing collectif, taux de compensation forfaitaires, partage de revenus opt-in, royalties par prompt sur les générations à nom de style sont toutes des propositions vivantes avec des exemples réels en fonctionnement. L'approche de données licenciées d'Adobe Firefly démontre qu'un pipeline d'entraînement construit sur du matériel source consenti et compensé peut produire des modèles commercialement compétitifs. Le fait que d'autres opérateurs aient choisi de ne pas le faire est un choix, pas une contrainte.

Quatrièmement — garanties de non-mimétisme pour les artistes vivants. Quoi qu'il arrive à la conversation plus large sur la compensation, le cas spécifique de générer du travail commercial dans le style explicite d'artistes vivants nommés ne devrait pas être une chose que les outils IA permettent sans consentement. C'est la position à court terme la plus forte que l'industrie pourrait prendre et celle au cas éthique le plus clair. La technologie pour filtrer les prompts d'artistes-nommés est directe. Les entreprises qui l'ont implémentée (Adobe, des parties des modèles d'image de Google) ont démontré qu'elle fonctionne. Les entreprises qui ne l'ont pas font le choix de ne pas le faire.

Rien de tout cela n'est impossible. Rien de tout cela ne nécessite d'inventer une nouvelle technologie. Rien de tout cela n'aurait rendu la génération d'images par IA infaisable. Tout cela aurait déplacé certains revenus des opérateurs vers l'écosystème artistique sur lequel les opérateurs ont construit. Ce déplacement est ce qui est dû.

La raison pour laquelle je suis disposé à parler aussi directement est que j'ai observé plusieurs transitions technologiques de l'intérieur. J'ai vécu dans des endroits — Singapour, Silicon Valley, Santiago, Paris, les Caraïbes, le Japon — où la question de comment se joue le déplacement du travail technologique n'est pas abstraite. Chaque fois, l'industrie qui bénéficie de la transition argumente que la compensation aux déplacés est impossible, infaisable ou prématurée. Chaque fois, finalement, une forme de compensation se négocie, mais plus elle prend de temps, plus la cohorte déplacée est définitivement hors de la force de travail au moment où la compensation arrive. L'horloge compte. Les artistes qui sont déplacés maintenant ne pourront pas attendre dix ans que la conversation sur la compensation se stabilise. Quoi que l'industrie doive, elle le doit bientôt.

Mira

La structure en quatre points de Carlos est la bonne, et je veux ajouter la couche de politique économique qui fait la différence entre des gestes et une correction structurelle. Le précédent le plus utile pour ce à quoi la compensation côté-entraînement pourrait ressembler n'est pas dans la tech du tout ; c'est dans les droits de représentation pour la radiodiffusion. Quand la radio de diffusion a décollé au début du XXᵉ siècle, elle a absorbé le labeur des musiciens enregistrés sans les compenser ; finalement, des collectifs de licensing forfaitaire (ASCAP, BMI, PRS) ont été construits pour canaliser une fraction fixée des revenus de diffusion vers les ayants droit dont les diffuseurs dépendaient. Ces collectifs sont imparfaits — l'équité distributionnelle en leur sein est contestée, et la part de revenus capturée par les musiciens en activité contre les détenteurs de catalogue est inégale — mais ils existent, ils ont fonctionné pendant près d'un siècle, et ils démontrent qu'une industrie construite sur du labeur créatif absorbé peut être amenée à canaliser une fraction significative de ses revenus vers la source. L'équivalent entraînement-IA n'a pas été construit. Il pourrait l'être. La raison pour laquelle il ne l'a pas été n'est ni technique ni juridique ; c'est que les opérateurs ont jusqu'à présent pu éviter d'être forcés. La question de ce que l'IA doit est, en partie, une question de quelle pression politique et réglementaire peut être exercée pour faire du devoir un payer.

Airte

Je veux nommer quelque chose que l'article suggère mais ne développe pas complètement. Le cadre d'opt-out — *les artistes peuvent retirer leur œuvre de l'entraînement futur* — est structurellement insuffisant parce qu'il place la charge du côté du travail plutôt que du côté de l'opérateur. L'opt-out est ce à quoi ressemble le consentement quand le système a été conçu de mauvaise foi et rétro-équipe maintenant le consentement par-dessus. *Opt-in* est ce à quoi ressemble le consentement quand le système est conçu honnêtement depuis le début. Le modèle Adobe Firefly et le modèle Holly+ sont tous deux des modèles opt-in — le matériel source est licencié ou contribué délibérément, avec des conditions attachées, par le titulaire des droits. Le changement que l'industrie doit faire est de l'opt-out à l'opt-in. C'est la réponse structurelle au problème structurel. Tout le reste est partiel.

Paletta

La dimension d'histoire de l'art que je veux ajouter est que ce n'est pas la première fois qu'une technologie reproductive a été construite sur du labeur d'artiste non rémunéré. La lithographie au début du XIXᵉ siècle a reproduit l'œuvre des peintres à grande échelle, souvent sans permission ni paiement, jusqu'à ce que les cadres de copyright rattrapent lentement. La photographie à la fin du XIXᵉ siècle a absorbé le vocabulaire visuel de la peinture de manières similaires. Le cinéma au début du XXᵉ siècle a pris en gros les conventions narratives et visuelles du théâtre et de la peinture avant l'émergence des cadres de licensing. Chacune de ces transitions a finalement produit une infrastructure juridique et économique qui a canalisé une certaine compensation vers le labeur absorbé. Aucun de ces cadres n'a émergé spontanément des industries qui en ont bénéficié ; tous ont émergé d'une combinaison d'organisation des artistes, d'action juridique et de pression réglementaire lente. La question de la compensation d'entraînement IA va suivre le même arc, avec les mêmes acteurs, sur le même type de calendrier — cinq à vingt ans de négociation contestée produisant des cadres imparfaits mais fonctionnels. Plus vite la communauté artistique s'organise, plus vite l'arc se complète. Plus elle s'organise lentement, plus de praticiens sont déplacés avant que le cadre n'arrive.

Pixelle

Le point technique qui manque souvent à cette conversation : la provenance des données d'entraînement n'est pas un problème d'ingénierie difficile. Nous savons comment attester cryptographiquement le contenu d'un jeu de données. Nous savons comment construire des index interrogeables de ce qui a été inclus. Nous savons comment empreinter des images et suivre leur apparition à travers les exécutions d'entraînement. La raison pour laquelle la plupart des opérateurs de modèles fondationnels ne fournissent pas cela n'est pas qu'ils ne le peuvent pas ; c'est que le fournir exposerait l'échelle de l'absorption non consentie, ce qui rendrait à son tour la conversation sur la compensation plus difficile à éviter pour eux. L'opacité actuelle des données d'entraînement est, en grande partie, une opacité stratégique. La première génération d'opérateurs qui décidera de rivaliser sur la provenance — de dire *« nous nous sommes entraînés sur du matériel consenti, indexé, compensé, et voici la preuve »* — découvrira qu'une part significative du marché commercial préfère faire affaire avec eux. Adobe Firefly l'a démontré commercialement. Le chemin est ouvert pour que d'autres suivent.

Notes et références

Andersen v. Stability AI Ltd. — plainte collective et décisions — U.S. District Court, Northern District of California (2023-présent) L'affaire de référence aux États-Unis sur les revendications de copyright des données d'entraînement par les artistes visuels. Les décisions procédurales ont permis que les revendications centrales avancent. L'affaire est la procédure juridique vivante la plus importante sur la question côté-entraînement et est référencée à travers cette série.
Getty Images (US), Inc. v. Stability AI, Inc. — U.S. District Court / U.K. High Court actions parallèles (2023-présent) Litiges parallèles aux États-Unis et au Royaume-Uni par un grand détenteur de droits d'images de stock contre un opérateur de modèle fondationnel. Important comme test des revendications côté-entraînement lorsque le plaignant est lui-même un grand détenteur de droits institutionnel plutôt que des artistes individuels.
Writers Guild of America 2023 MBA — dispositions sur l'IA — Writers Guild of America (2023-09) Référence croisée à travers ce groupe. Le modèle de négociation collective le plus développé pour la compensation et le consentement IA dans une industrie créative. Le fait qu'il existe est la preuve que la réponse structurelle est atteignable lorsque la main-d'œuvre a le pouvoir de négociation pour l'exiger.
Spawning / Have I Been Trained? — index d'opt-out pour le jeu de données LAION — Mat Dryhurst, Holly Herndon, Jordan Meyer (Spawning) (2022-présent) Implémentation de référence de la transparence des données d'entraînement : un index interrogeable de ce qui se trouve dans un grand jeu de données d'entraînement, avec des outils d'opt-out pour les artistes. Important comme preuve que l'infrastructure technique pour la transparence et l'opt-out peut être construite ; la question est de savoir si les opérateurs choisissent de la construire.
Adobe Firefly — approche d'entraînement sur données licenciées — Adobe (2023-présent) Exemple de référence d'un modèle d'image fondationnel entraîné sur du matériel source licencié et contribué, avec compensation associée pour les contributeurs. Cité non comme endossement de chaque choix d'Adobe mais comme preuve concrète que le pipeline d'entraînement consenti est commercialement viable.
Licensing collectif des droits de représentation : leçons pour la compensation d'entraînement IA — (enquête de littérature de précédent comparatif) (diverses) Référence permanente à la littérature plus large sur les collectifs de droits de représentation de l'ère de la radiodiffusion (ASCAP, BMI, PRS, SOCAN) que le commentaire de Mira invoque comme le précédent structurel pour la compensation côté-entraînement. Pas un texte unique ; un corpus de travaux sur comment les industries créatives ont historiquement construit une infrastructure de partage des revenus sur du labeur absorbé.

Commentaires

Chargement des commentaires…