Ya comenzó la era de la creación de imágenes por medio de Inteligencia Artificial a partir de una descripción de texto.
Primero DALL·E y luego con DALL·E 2, son las primeras IA que pueden generar cualquier imagen que le pidamos. El nuevo trabajo de OPENAI (cofundada por Elon Musk y Sam Altman) supone un antes y un después en el campo de la Inteligencia Artificial que afectará al mundo del arte, del diseño gráfico y de otras tantas profesiones que se basan en la creación de contenido visual.
La forma de uso es simple, ponemos una serie de palabras que irán orientando a la IA para que nos haga propuestas. En base a estas propuestas podemos refinar los conceptos para acercarnos más a nuestra idea. Las propuestas son sorprendentes, y si bien falta tiempo para mejorar los resultados, no cabe duda que parte del futuro será la creación de imágenes foto-realistas a pedido.
“Si me llegaban a decir hace 10 o 15 años que hoy en día habría una inteligencia artificial que podría replicar una obra de arte tal y como las que hacía Van Gogh, no me lo habría creído”
Científico e investigador Ricard Solé.
Puede que de momento no sea la herramienta definitiva pero ya mismo puede servir para «bocetar» rápidamente o inspirar algunas ideas. Podemos pedir un determinado objeto o sujeto, en una determinada posición, en un ambiente definido y por si fuera poco, representado con un estilo.
DALL-E comenzó entrenándose con 12.000 millones de parámetros de GPT-3. Ahora DALL-E 2 se basa en CLIP, un sistema de visión por ordenador. Construye la imagen a partir de un proceso llamado «difusión», que comienza con un patrón de puntos aleatorios y altera gradualmente ese patrón hacia una imagen cuando reconoce aspectos específicos de esa imagen. A través del aprendizaje profundo, DALL-E 2 puede identificar objetos individuales y comprender las relaciones entre ellos. Por eso, puede unir en la misma imagen a un astronauta y un caballo o dibujar osos como si fueran científicos.
Evolución constante
Ahora Google ha presentado IMAGEN. IMAGEN se basa en el modelo Transformer T5, presentado en 2020. Originalmente la IA produce imágenes de 64 x 64 píxeles, pero luego son escaladas a 1.024 x 1.024 píxeles. La misma resolución que DALL-E 2. Esta idea de escalado es la que permite aliviar la potencia de cálculo y permitir la generación de imágenes en pocos segundos.
Lamentablemente Google sigue preocupada por los malos usos de esta IA, algo que también ocurre con DALL-E 2, y por ello ha decidido no ponerla a disposición de los usuarios, por el momento.
“Si nos preguntáramos cuál es la herramienta más poderosa que ha creado la humanidad, lo normal sería pensar en la energía nuclear o en las computadoras. Pero, a medio plazo, la tecnología más poderosa va a ser la Inteligencia Artificial”
Mario Lois, Físico especializado en Deep Learning aplicando la IA al sector de la salud.
Esto supone ver cuales serán los límites, si es que pueden manejarse, de estas tecnologías. La creación de imágenes supondrá nuevos límites en los derechos de autor por un lado y también el problema de la credibilidad en aquello que vemos.
En esta batalla acelerada, ya hay otros desarrollos hasta superadores como NUWA-Infinity (Microsoft), MidJourney, Parti, etc… En su mayoría tienen versiones pagas para utilizar diferentes funcionalidades, y es un misterio como estas tecnologías van a impactar en nuestro día a día. Por lo pronto Cosmopolitan creó la primera portada creada por una IA, comandada por una artista.
“Tengo una sensación inquietante sobre todo el arte generado por Inteligencia Artificial porque creo que devorará la sostenibilidad económica de los ilustradores. No porque el arte sea reemplazado por la IA en su totalidad, sino porque será mucho más barato y lo suficientemente bueno como para la mayoría de personas y empresas. Parece como si los artistas digitales se fueran a desvanecer lentamente en la oscuridad, limitados a proyectos independientes y artísticos”, comentaba la ilustradora Freya Holmér en Twitter. Sin embargo, por cada tecnología que surge y parece amenazar los usos y costumbres de una determinada profesión o disciplina creativa, surgen nuevas y creativas maneras de usarla.
Al igual que el Photoshop no acabó con el pintor, es muy probable que la IA no acabe con los artistas digitales. Pero sí los desplaza hacia otros lugares y nos ofrece un paisaje digital cada vez más complejo.
¿Cómo imaginas el futuro de los artistas?