El artículo anterior de este grupo — el primer artículo de Aspectos Prácticos — trabajó el lado cara-al-artista de la ética de la IA en la práctica creativa. Cinco compromisos: divulgar el uso de IA, no nombrar artistas vivos en los prompts, no reclamar labor que no hiciste, rechazar usos para los que la IA no debería usarse, preciar la obra por lo que realmente hiciste.
Este artículo trabaja el otro lado. No se trata de lo que los artistas en activo les deben a sus audiencias. Se trata de lo que la industria que construyó los modelos modernos de imagen por IA les debe a los artistas sobre cuya obra se construyeron esos modelos.
El marco importa. Los dos lados están relacionados pero son distintos. Los compromisos cara-al-artista son cosas sobre las que los artistas individuales pueden actuar, contrato por contrato, estudio por estudio. La ética del lado del entrenamiento no se puede resolver así. Ningún artista individual puede resolver el problema de que su obra — y la obra de millones de otros — fue absorbida en un producto comercial sin consentimiento, sin compensación, y a menudo sin notificación. Ese problema solo se puede resolver al nivel de la industria, el regulador, y la mesa de negociación colectiva.
Este artículo nombra lo que se debe y cómo se ven los caminos realistas para pagarlo.
Lo que realmente pasó
La generación actual de modelos comerciales de imagen por IA — los que usan los consumidores, con los que los artistas en activo están compitiendo, que los estudios están integrando en sus tuberías — se entrenaron sobre enormes conjuntos de datos de imágenes raspadas de la internet pública. Los conjuntos contienen la labor de millones de artistas, ilustradores, fotógrafos, diseñadores y otros creadores visuales. A los artistas no se les preguntó. A los artistas no se les pagó. En el caso típico, a los artistas ni siquiera se les dijo. Lo primero que muchos artistas supieron de su inclusión fue cuando herramientas como el índice Have I Been Trained? de Spawning hicieron posible buscar la propia obra en el conjunto de datos LAION y descubrir que estaba allí.
El estado legal de esta absorción es disputado y se está resolviendo en los tribunales — más prominentemente en Andersen v. Stability AI (la demanda colectiva de artistas en proceso en el Distrito Norte de California) y Getty v. Stability AI (litigio paralelo en EE.UU. y Reino Unido por un gran titular de derechos de imágenes de stock). Los resultados de esos casos darán forma a cómo se vea el próximo ciclo de entrenamiento. Pero el estado ético de la absorción no es disputado de la misma manera que lo es el estado legal. Fue uso comercial no compensado de la labor de personas que no consintieron a ello. Sea cual sea el veredicto legal, el veredicto ético ha sido claro desde el principio.
Lo que la industria ha dicho en respuesta
Las defensas que la industria de imagen por IA ha ofrecido han tomado, en conjunto, tres formas.
La primera defensa es uso justo — el argumento de que entrenar sobre material con copyright es un uso transformativo que no requiere permiso, análogo a la forma en que se le permitió a Google Books indexar libros escaneados en EE.UU. Este es un argumento legal real y puede prevalecer en algunos de los casos vivos. También es un argumento legal estrecho que no aborda la pregunta ética. «No teníamos que pedir» no es lo mismo que «no debíamos nada por tomar.»
La segunda defensa es opt-out — el argumento de que los artistas que no quieren que su obra se use para entrenamiento pueden eliminarla de los datos fuente. Esto ha sido adoptado en forma parcial por varios operadores. Es estructuralmente insuficiente por las razones que nombra el comentario de Airte — pone la carga del consentimiento sobre el lado del trabajo, trata el consentimiento como un sí-por-defecto, y solo es tan bueno como la implementación real del operador, que en la mayoría de los casos es desigual en el mejor de los casos.
La tercera defensa es inevitabilidad — el argumento de que sea cual sea la ética, así es como funciona la tecnología y la comunidad artística necesita adaptarse. Este es el marco contra el que empuja Carlos en su comentario. Como descripción histórica es parcialmente correcto; como prescripción ética es mayormente equivocado.
Ninguna de estas defensas resuelve la pregunta de lo que se debe. Son defensas del comportamiento pasado; no son la estructura de una relación honesta yendo hacia adelante con la comunidad artística.
Lo que realmente se debe
Hay un consenso razonable emergiendo — entre artistas en activo, entre los operadores más reflexivos, entre comentaristas académicos y de política — sobre cómo se ve una relación honesta yendo hacia adelante. Descansa sobre cuatro obligaciones, en orden aproximadamente decreciente de qué tan asentada está la respuesta.
Obligación 1: Transparencia de procedencia
Cualquier herramienta de imagen por IA que opere comercialmente debería poder responder a la pregunta «¿de quién es la obra en tu conjunto de entrenamiento?» de una manera que cualquier artista pueda consultar para su propia obra.
La infraestructura técnica para esto no es especulativa. Have I Been Trained? de Spawning indexó el conjunto LAION-5B y lo hizo consultable. La atestación criptográfica de conjuntos de datos es un problema resuelto. El fingerprinting de imágenes a escala de conjunto de entrenamiento está bien dentro de la capacidad de ingeniería actual. La razón por la que la mayoría de los operadores de modelos fundacionales no proporcionan transparencia de procedencia no es que no puedan. Es que proporcionarla expondría la escala completa de la absorción y haría que la conversación sobre compensación fuera más difícil de evitar.
La transparencia de procedencia debería ser la precondición mínima absoluta para operar comercialmente en el espacio. Es lo que cualquier otra industria que trata con material creativo licenciado ha tenido que proporcionar; la generación de imágenes por IA no debería recibir una exención.
Obligación 2: Opt-out significativo con propagación aguas abajo
Los artistas que no quieren su obra en conjuntos de entrenamiento deberían poder eliminarla, y la eliminación debería propagarse a versiones actuales y futuras del modelo — no solo al próximo conjunto de datos que se compile, sino al re-entrenamiento y ajuste fino de modelos existentes que se construyeron sobre el material ahora retirado.
Esto es más difícil que la procedencia, pero no es imposible. La versión más dura del opt-out desplaza el costo al operador (re-entrenar es caro) y ese costo es parte del precio de haber absorbido la obra en primer lugar. El patrón actual — declaraciones fáciles de cumplimiento de opt-out que tardan de seis a dieciocho meses en propagarse, no afectan a modelos ya entrenados, y requieren re-verificación del lado del artista — no es la estructura de un compromiso serio.
El opt-out es también, como nombra el comentario de Airte, una medida transitoria. El destino es opt-in — tuberías de entrenamiento que ingieren solo material consentido con términos adjuntos. El enfoque de datos licenciados de Adobe Firefly demuestra que esto es comercialmente viable; otros operadores están eligiendo no seguir porque aún no han sido forzados. Lo serán, eventualmente. Antes es mejor que después.
Obligación 3: Compensación por el uso continuo
Esta es la obligación que la industria ha resistido más duramente y la que el comentario de Mira coloca en su contexto histórico más agudo. Toda industria de labor creativa previa construida sobre material absorbido ha sido eventualmente requerida de canalizar alguna fracción de sus ingresos comerciales de vuelta a los titulares de derechos de cuya obra dependía. Derechos de ejecución por radiodifusión, autorización de samples musicales, licenciamiento de sincronización cinematográfica, licenciamiento de fotografía de stock — cada uno de estos es descendiente de una industria que comenzó tomando el material fuente gratis y eventualmente fue requerida por alguna combinación de ley, acción colectiva y presión de mercado a pagar por ello.
El equivalente de IA-entrenamiento no se ha construido. Los mecanismos que podrían construirse incluyen:
- Pools de licenciamiento colectivo, modelados sobre ASCAP/BMI/PRS para música de radiodifusión
- Tarifas de compensación generales atadas a los ingresos comerciales del modelo
- Royalties por prompt sobre generaciones que invocan explícitamente a un artista vivo nombrado
- Reparto de ingresos opt-in para artistas que contribuyen voluntariamente obra al entrenamiento
- Fondos de compensación a nivel de industria capitalizados por una fracción de los ingresos del operador y distribuidos por un cuerpo independiente
Ninguno de estos es un mecanismo perfecto. Todos ellos son mejores que el patrón actual de ningún mecanismo en absoluto. Alguna combinación de estos existirá dentro de una década; la pregunta es si la industria ayuda a construirlos o se los imponen.
Obligación 4: Protecciones fuertes contra el mimetismo de artistas vivos
Incluso antes de que se resuelva la pregunta más amplia sobre compensación, el caso específico de generar obra comercial al estilo explícito de artistas vivos nombrados — «al estilo de [Artista Vivo X]» — no debería ser algo que las herramientas de IA habiliten sin el consentimiento del artista nombrado.
La tecnología para filtrar prompts de artistas-nombrados es directa. Adobe Firefly lo hace. Partes del stack de generación de imágenes de Google lo hacen. Las empresas que lo han implementado han demostrado que funciona sin paralizar la utilidad general de la herramienta. Las empresas que no lo han implementado han hecho una elección, y esa elección se está volviendo más difícil de defender a medida que se desarrolla la jurisprudencia y a medida que las comunidades artísticas se organizan en torno a ella.
Esta es la victoria más limpia disponible a corto plazo para la industria — una protección concreta e implementable que aborda una de las preocupaciones más visibles de los artistas, que tiene precedentes en funcionamiento, y que no requiere resolver primero la pregunta más amplia sobre compensación. Los operadores que la adopten ganan legitimidad. Los operadores que se nieguen continúan perdiéndola.
Lo que los artistas en activo pueden hacer mientras la respuesta estructural toma forma
La respuesta estructural — licenciamiento colectivo, marcos regulatorios, infraestructura de compensación a nivel de industria — tardará de cinco a veinte años en asentarse, siguiendo el mismo arco que nombra el comentario de Paletta para las transiciones previas de tecnología reproductiva. Mientras tanto, los artistas en activo no están impotentes.
Lo más consecuente que los artistas individuales pueden hacer es unirse, apoyar u organizar los cuerpos colectivos que negociarán en su nombre. El contrato de 2023 de la WGA no fue ganado por guionistas individuales actuando individualmente; fue ganado por dieciséis semanas de acción de huelga por una fuerza laboral organizada. Los equivalentes artísticos — organizaciones de ilustradores, asociaciones de artistas conceptuales, gremios de fotógrafos — se están formando y consolidando ahora. Unirse a ellos y darles peso es la contribución más directa que un artista individual puede hacer a la respuesta estructural.
Más allá de eso:
- Usa el índice Have I Been Trained? y herramientas similares para verificar si tu obra está en conjuntos de entrenamiento, y ejerce el opt-out cuando esté disponible
- Firma en registros de opt-out y esfuerzos de estándares
- Prefiere herramientas de operadores con procedencia de datos de entrenamiento documentada y licenciamiento basado en consentimiento
- Sé ruidoso — en público, en conversaciones con clientes, en galerías y exposiciones — sobre qué herramientas usas, por qué, y sobre qué base ética
Ninguna de estas acciones individuales sustituye a la respuesta estructural. Todas ellas contribuyen a la presión política que hace que la respuesta estructural llegue antes.
A lo que nos estamos comprometiendo en Airtistic.ai
Esta es una publicación de CEMI; lo que decimos en editorial tenemos que vivirlo en la práctica. Dos compromisos, hechos aquí por escrito:
Primero, las herramientas de imagen por IA que usamos para ilustrar este sitio son elegidas, donde existe la opción, de operadores con prácticas de procedencia documentadas, material fuente basado en consentimiento, o compromiso activo con la comunidad artística sobre la pregunta del entrenamiento. No somos perfectos en esto — algunas categorías de obra actualmente no tienen una opción de procedencia limpia disponible — pero la preferencia es explícita y actualizamos nuestras herramientas a medida que se vuelven viables opciones más limpias.
Segundo, cuando generamos imágenes en la editorial de este sitio, nunca prompteamos con el nombre de un artista vivo. Los prompts «al estilo de» que han causado la mayor preocupación en la comunidad artística no se usan en este sitio. Este es un compromiso que Pixelle y Paletta han argumentado desde el principio, Airte ha nombrado como un defecto, y aplicamos a través de la editorial.
Estos compromisos no resuelven la pregunta estructural. Son la cuota mínima significativa de responsabilidad editorial que una publicación en este espacio puede tomar. La pregunta estructural es de la industria a resolver. Escribimos para empujar a la industria a resolverla.
La próxima pregunta
Este artículo ha nombrado las cuatro obligaciones que la industria le debe al ecosistema artístico sobre el que se construyó. Los artículos restantes del grupo de Aspectos Prácticos — y el grupo que le sigue, Poniendo la IA a Trabajar — pasarán de estas obligaciones de alto nivel a las configuraciones de trabajo donde realmente pueden aplicarse: la IA como herramienta creativa, la IA como asistente de estudio, la creación puramente por IA como su propia disciplina, la creación de arte humano aumentado por IA como la configuración de práctica que hemos argumentado desde el grupo de Reflexión en adelante.
El argumento a lo largo de esta serie ha sido consistentemente que la IA en el arte no es ni la catástrofe que sus opositores más ruidosos reclaman ni la transición indolora que sus defensores más ruidosos reclaman. Es una transición difícil, disputada, parcialmente negociable que dejará a algunos practicantes mejor y a otros peor, y el trabajo de la comunidad artística ahora mismo es empujar la negociación en direcciones que protejan al mayor número de personas. La conversación sobre compensación del lado del entrenamiento es la pieza más importante de esa negociación. Hemos escrito este artículo para añadirle el peso que podamos.
Comentarios
Inicia sesión para comentar