La alegría y el pavor de los generadores de imágenes de IA sin límites

Los generadores de imágenes como Stable Diffusion pueden crear lo que parecen fotografías reales o ilustraciones hechas a mano que representan casi cualquier cosa que una persona pueda imaginar. Esto es posible gracias a algoritmos que aprenden a asociar las propiedades de una vasta colección de imágenes tomadas de la web y bases de datos de imágenes con sus etiquetas de texto asociadas. Los algoritmos aprenden a representar nuevas imágenes para que coincidan con un mensaje de texto en un proceso que implica agregar y eliminar ruido aleatorio de una imagen.

Debido a que herramientas como Stable Diffusion usan imágenes extraídas de la web, sus datos de entrenamiento a menudo incluyen imágenes pornográficas, lo que hace que el software sea capaz de generar nuevas imágenes sexualmente explícitas. Otra preocupación es que tales herramientas podrían usarse para crear imágenes que parecen mostrar a una persona real haciendo algo comprometedor, algo que podría difundir información errónea.

La calidad de las imágenes generadas por IA se ha disparado en el último año y medio, comenzando con el anuncio en enero de 2021 de un sistema llamado DALL-E por parte de la empresa de investigación de IA OpenAI. Popularizó el modelo de generación de imágenes a partir de indicaciones de texto, y en abril de 2022 le siguió un sucesor más potente, DALL-E 2, ahora disponible como servicio comercial.

Desde el principio, OpenAI ha restringido quién puede acceder a sus generadores de imágenes, brindando acceso solo a través de un aviso que filtra lo que se puede solicitar. Lo mismo ocurre con un servicio de la competencia llamado Midjourney, lanzado en julio de este año, que ayudó a popularizar el arte creado por IA al ser ampliamente accesible.

Stable Diffusion no es el primer generador de arte de IA de código abierto. No mucho después del lanzamiento del DALL-E original, un desarrollador creó un clon llamado DALL-E Mini que se puso a disposición de cualquiera y rápidamente se convirtió en un fenómeno de creación de memes. DALL-E Mini, más tarde rebautizado como Craiyon, todavía incluye barandas similares a las de las versiones oficiales de DALL-E. Clement Delangue, director ejecutivo de HuggingFace, una empresa que alberga muchos proyectos de IA de código abierto, incluidos Stable Diffusion y Craiyon, dice que sería problemático que la tecnología fuera controlada solo por unas pocas grandes empresas.

“Si observa el desarrollo a largo plazo de la tecnología, hacerla más abierta, más colaborativa y más inclusiva, en realidad es mejor desde una perspectiva de seguridad”, dice. La tecnología cerrada es más difícil de entender para los expertos externos y el público, dice, y es mejor si los externos pueden evaluar los modelos en busca de problemas como los sesgos de raza, género o edad; además, otros no pueden construir sobre tecnología cerrada. En general, dice, los beneficios de la tecnología de fuente abierta superan los riesgos.

Delangue señala que las empresas de redes sociales podrían usar Stable Diffusion para crear sus propias herramientas para detectar imágenes generadas por IA que se usan para difundir desinformación. Él dice que los desarrolladores también contribuyeron con un sistema para agregar marcas de agua invisibles a las imágenes creadas con Stable Diffusion para que sean más fáciles de rastrear, y crearon una herramienta para encontrar imágenes particulares en los datos de entrenamiento del modelo para que las problemáticas puedan eliminarse.

Después de interesarse en Unstable Diffusion, Simpson-Edin se convirtió en moderador en Unstable Diffusion Discord. El servidor prohíbe que las personas publiquen ciertos tipos de contenido, incluidas imágenes que podrían interpretarse como pornografía infantil. “No podemos moderar lo que la gente hace en sus propias máquinas, pero somos extremadamente estrictos con lo que se publica”, dice. En el corto plazo, contener los efectos disruptivos de la creación de arte con IA puede depender más de los humanos que de las máquinas.