El nuevo Midjourney V5 es aún más asombroso que sus predecesores. Y por fin, manos (casi) realistas

Que el ritmo no pare. Si el martes conocíamos un GPT-4 y sus capacidades renovadas, hace una hora ver anunciaba el lanzamiento de Midjourney V5, una versión aún más potente de este motor de IA generador de imágenes. Los que ya han podido probarlo y publicar los resultados alucinan. Nosotros tramién.
A mitad de camino V5. El nuevo motor cuenta según sus creadores con «mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio», entre otras mejoras.
foto de estilo callejero de una mujer joven, chaqueta gucci roja, camisa gucci azul, plano general, iluminación natural, soho, filmada en Agfa Vista 200, 4k –ar 16:9
v4 (izquierda) v5 (derecha) pic.twitter.com/I80Bd0EEyP
— Nick St. Pierre (@nickfloats) 15 de marzo de 2023
Resultados alucinantes. Son muchos los usuarios que compartieron imágenes creadas con Midjourney V5 o pequeñas comparativas que muestran el resultado de Midjourney V4 y la nueva Midjourney V5. Aquí incluimos algunas del hilo creado por Nick St. Pierre, diseñador que está explorando estas opciones. Si las imágenes de su antecesor ya eran espectaculares, aquí el motor va un poco más allá y aporta aún más realismo. Algunas imágenes son casi imposibles de distinguir de las imágenes reales.
Disparo de multitud
Foto de estilo callejero de los años 60 de una multitud de mujeres jóvenes de pie en un velero, con vestidos dior hechos de seda, collares de perlas, puesta de sol sobre el océano, tomada en Agfa Vista 200, 4k –ar 16:9 pic.twitter.com/cEacab3T8m
— Nick St. Pierre (@nickfloats) 15 de marzo de 2023
Más objetivo. El subreddit /r/midjourney tiene más información sobre esta versión, que según los detalles publicados hace que Midjourney V5 sea menos subjetivo en su comprensión de las indicaciones. «Los detalles tienen más probabilidad de ser correcto y habra menos texto no deseoado», se explica en esa información.
Era de la década de 1990, foto de un hombre joven, sentado, teclado mecánico, trabajando, escritorio, monitor CRT de la década de 1990, monstera, 1 vaso de jugo de naranja, jugo, plano general, vista lateral, iluminación natural, hogar, polaroid, 4k, año 16: 9
v4 (izquierda) v5 (derecha) pic.twitter.com/iMvG5z81mU
— Nick St. Pierre (@nickfloats) 15 de marzo de 2023
Los buenos avisos importantes más que nunca. Los creadores de Midjourney revelan que la nueva versión es especialmente sensible a las entradas de texto, por lo que más que nunca lo importante es ser muy concreto con lo que queremos y dar el máximo detalle posible para no encontrarnos con decepciones. Los prompts cortos no pueden funcionar tan bien como antes duedo a esto.
Foto de estilo callejero, toma de primer plano, Nike Air Force 1 slytherin collab, Colorway único, piel de serpiente, hogwarts, iluminación natural, original, único, 4k –ar 16: 9 pic.twitter.com/5mZihLHc4D
— Nick St. Pierre (@nickfloats) 15 de marzo de 2023
Mejor entrenado. Midjourney V5 es el segundo modelo entrenado con el supercúmulo de IA de sus creadores y lleva cinco meses en desarrollo. Sus responsables afirman que usa arquitecturas de redes neuronales «significativamente diferentes» y nuevas técnicas estéticas.
5 dedos a mitad de camino v5. pic.twitter.com/tEYWIdwcSg
– Fumar lejos (@SmokeAwayyy) 16 de marzo de 2023
Manos al fin (casi) realistas. Otro de los avances que se parece haber logrado —aunque los responsables no se mencionan específicamente— es el de las manos que aparecen en las imágenes generadas, y que mejoran mucho: suelen contar con los cinco dedos bien representados, por ejemplo. Es cierto que Midjourney V5 sigue cometiendo errores en algunas imágenes desafiantes, pero el progreso es notable en este sentido.
A mitad de camino v5
muchas manos juntas –p 11 –v 5 pic.twitter.com/hdTdU8cNfo
— Roman Pshichenko (@romechenko) 16 de marzo de 2023
Esto no es el final. Aún así, destacan, «este no es el paso final». Eso deja claro que la evolucion de Midjourney sigue su marcha imparable junto al de otras plataformas como Stable Diffusion o DALL-E 2. Mientras todas estas plataformas avanzan, eso sí, seguimos esperando al «Midjourney del vídeo», que por el momento parece resistirse a aparecer
Imagen: activista del carisma