The New Yorker. Por Kyle Chayka/Ilustración de Nicholas Konrad
Vivimos en un mundo en el que cada estilo, cada idea y cada remezcla posible se puede generar lo más rápido y sin fricción posible.
“El mes pasado, un usuario de YouTube llamado demonflyingfox subió un vídeo titulado “Harry Potter de Balenciaga”. Mostraba a los personajes de las películas de Harry Potter, Hagrid, Ron, Hermione, Snape, McGonagall, Dobby, como modelos demacros con pómulos agresivos (ligeramente jasificados), vestidos con capas góticas y chaquetas de cuero. Enfrentado a un ritmo electrónico digno de una pasarela, los actores parpadean, asinieron con la opinión y hablan líneas de los libros que han sido remezclados con referencias de moda. “Eres Balenciaga, Harry”, dice Hagrid, en lugar de dar la noticia de que Harry es un mago. El vídeo es extraño e hilarantemente siniestro. En tres semanas, ha recibido casi cinco millones de visitas; una secuela, lanzada hace menos de una semana, ha obtenido más de un millón y medio. Los mashups de la cultura pop de una cosa famosa con otra son un arquetipo de creación de memes en Internet. Lo inusual de “Harry Potter de Balenciaga” es que se generó con herramientas de inteligencia artificial. Como me dijo el creador del vídeo, el fotógrafo con sede en Berlín Alexander Niklass, que hizo el canal de demonflyingfox, el vídeo demuestra una nueva capacidad de la I.A. para “crear momentos cinematográficos”.
Las herramientas de I.A. participaron en cada paso del proceso de Niklass y en cada elemento del vídeo. Creó las imágenes estáticas básicas con Midjourney, evocando a los actores y trajes de Harry Potter a través de indicaciones de texto como “modelo masculino, grotesco, comercial de balenciaga”. Luego usó ElevenLabs, una herramienta de “clonación de voz”, para crear modelos de las voces de los actores basados en el audio grabado previamente. Finalmente, introdujo las imágenes en un servicio llamado D-ID, que se utiliza para hacer “vídeos de avatares”, retratos sutilmente animados, no tan lejos de los que aparecen en los periódicos del mundo de Potter. D-ID agregó las características de los labios sincronizados y los asinciones de cabeza, que Niklass explicó que eran una referencia a los modelos de moda que inclinaban sus barbillas para las cámaras. La combinación de cine para niños y moda de lujo para adultos no tenía ningún simbolismo en particular ni expresaba una intención artística. Es “entretenimiento”, dijo Niklass. Sin embargo, el aspecto más convincente del vídeo podría ser su vacuidad, una colisión sin sentido de símbolos culturales.
Las herramientas de la I.A. pueden haber sido capaces de replicar los rostros de los actores y generar trajes de moda, pero solo Niklass podría haber ideado el concepto, que requería una observación aguda tanto de la alta moda como del mundo mágico, y también un sentido del humor muy específico y extremadamente en línea. Con herramientas como Midjourney disponibles públicamente para cualquier persona en línea, “todo el mundo puede crear algo visualmente atractivo ahora”, dijo. “Pero la I.A. aún no puede generar sabor”, continuó. Por “sabor”, se refería a “un buen juicio estético”: conocimiento de fondo de lo que estás generando y un sentido de lo que se ve bien, sin caer demasiado lejos en el extraño valle. Para decirlo de otra manera, la ejecución puede haber sido democratizada por la I.A generativa, pero las ideas no lo han hecho. El humano sigue siendo el creador, editor y curador de los efectos de la I.A. La prueba del gusto de Niklass se puede encontrar en los muchos imitadores de sus vídeos ahora en YouTube: Cualquiera puede acceder a la misma tecnología e intentar una réplica siguiendo la fórmula que estableció. (Un video tutorial realizado por un canal de educación de I.A. llamado PromptJungle muestra el proceso exacto). Hay vídeos de “Matrix by Gucci“, “Star Wars by Balenciaga” y “The Office by Balenciaga“, pero ninguno de ellos es tan atractivo como el original.
Si bien nadie confundiría “Harry Potter de Balenciaga” con imágenes reales, excepto, tal vez, como una verdadera campaña de publicidad de moda, otra imagen generada por la I.A. recientemente llegó a los titulares de las noticias porque muchos pensaban que era real. Era, o parecía ser, una foto del Papa Francisco caminando por la calle con una versión barroca de una chaqueta acolchada, blanca sedosa, con un cuello alto y una capucha. Un collar cruzado se le salió del cuello y llevó un café para llevar. “Swagged out” sería una descripción apropiada. El detalle y la textura de la imagen la hacían parecer totalmente realista. Cuando lo encontré por primera vez, mientras me desplazaba rápidamente, pensé que era real y casi sin problemas, por supuesto, el Papa tiene ropa elegante. La modelo y actriz Chrissy Teigen tuiteó que “no lo pensó dos veces”. Pero fue creado usando Midjourney por un hombre de Chicago que se identificó como Pablo Xavier cuando estaba, como le dijo al Chicago Tribune, con setas. Utilizó indicaciones con frases como “Papa católico Francisco”. Abrigo hinchado de Balenciaga. Calles de París”. (Tal vez la marca de moda esté preparada para la A.I., o se le ocurra fácilmente como un significante del lujo vanguardista). “Solo pensé que era divertido ver al Papa con una chaqueta divertida”, dijo Xavier a BuzzFeed News.
Creadas sin mucha intención, además de un capricho imaginativo, las imágenes eran tan potentes porque se hicieron para parecer tan fotográficas, una capacidad que ahora está en manos de cualquier persona en línea, no solo de retocadores de fotos humanos altamente cualificados. La I.A. automatiza los impulsos creativos, negando el trabajo que implica producir una imagen o un vídeo. (Una versión real de los vídeos de “Harry Potter de Balenciaga” probablemente habría costado millones de dólares solo en talento). Reflexionando sobre esta discrepancia entre la entrada y la salida, tuve un diálogo con ChatGPT. Fue más socrático que una discusión real, un poco como hablar con el espejo. Pero me ayudó a dilucidar mis propias reacciones. Pregunté cómo las imágenes generadas por la I.A estaban cambiando nuestras percepciones. Respondió que ha habido un “desenfoque de las líneas entre lo real y lo artificial”. Entonces pregunté: ¿No es cierto que incluso una imagen “artificial” generada por la I.A. también es una cosa “real”, porque algún ser humano hizo que se hiciera, como una especie de cumplimiento de un deseo cultural? El robot respondió que el realismo de las imágenes de la I.A. “a menudo está diseñado para ser ilusorio”. Esta idea de “realismo ilusorio” me pareció adecuada. El contenido de la I.A. tiene la apariencia de realismo, sin realidad real, la realidad únicamente como un estilo.
En una entrevista de 2022, David Holz, el fundador de Midjourney, utilizó la frase “aceleración estética” para describir la profusión de imágenes generadas habilitadas por las herramientas públicas de I.I. Evoca un mundo en el que cada estilo, cada idea y cada remezcla posible se genera lo más rápido y sin fricción posible, y los exitosos se pegan y llaman la atención, como “Harry Potter de Balenciaga” y el Papa. Puede ser menos porque son artísticamente geniales que porque resolvieron alguna fórmula de atención. Tal vez la creación exitosa sea inimaginablemente extraña, la fusión perfecta de dos cosas no relacionadas. O está impulsado por la fascinación de la réplica perfecta, algo que sabemos que no es real, pero que es fácil de ver o percibir brevemente como tal, como una pintura de trompe-l’oeil.
Durante los últimos días, he estado haciendo un bucle de una nueva canción de hip-hop una y otra vez. Se llama “Savages“, por el equipo francés AllttA. La canción es dulcemente nostálgica, con cuerdas sintetizadas y un ritmo de caja; presenta lo que suena como versos comerciales de Jay-Z con Mr. J. de AllttA. Medeiros en un estilo de retroceso. Pero, por supuesto, no es Jay-Z; es un modelo de I.A. de su voz, utilizado, presumiblemente, sin el permiso del artista. Es otro ejemplo de realismo ilusorio. La canción escrita por humanos es buena por sí sola, y estaría perfectamente bien sin el falso Jay-Z, pero la voz familiar añade algo ineffablemente convincente a la pista, haciendo que suene como una cara B inédita de los años noventa. Tiene más de doscientas mil reproducciones en YouTube. “La idea de disfrutar de esto y su IA está más allá de mí”, escribió un usuario en los comentarios. Siento el mismo tipo de confusión existencial. Se pega en mi cerebro como un rompecabezas sin resolver. No me importa que en realidad no sea Jay-Z, en gran parte porque la calidad de la I.A. es lo suficientemente buena como para que yo, un no experto, apenas pueda notar la diferencia. Pero parece que se ha cruzado un Rubicón: no importa que estos artefactos sean generados por la I.A.; podemos disfrutarlos por lo que son. Sucedió más rápido de lo que pensé posible, pero ahora que la cultura pop generada por la I.A. ha entrado en la corriente principal, parece poco probable que alguna vez nos deshagamos de ella.”
Artículo publicado en The New Yorker. 7 de abril de 2023