El nuevo Midjourney V5 es aún más asombroso que sus predecesores. Y por fin, manos (casi) realistas


Que el ritmo no pare. Si el martes conocíamos un GPT-4 y sus capacidades renovadas, hace una hora ver anunciaba el lanzamiento de Midjourney V5, una versión aún más potente de este motor de IA generador de imágenes. Los que ya han podido probarlo y publicar los resultados alucinan. Nosotros tramién.

A mitad de camino V5. El nuevo motor cuenta según sus creadores con «mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio», entre otras mejoras.

Resultados alucinantes. Son muchos los usuarios que compartieron imágenes creadas con Midjourney V5 o pequeñas comparativas que muestran el resultado de Midjourney V4 y la nueva Midjourney V5. Aquí incluimos algunas del hilo creado por Nick St. Pierre, diseñador que está explorando estas opciones. Si las imágenes de su antecesor ya eran espectaculares, aquí el motor va un poco más allá y aporta aún más realismo. Algunas imágenes son casi imposibles de distinguir de las imágenes reales.

Más objetivo. El subreddit /r/midjourney tiene más información sobre esta versión, que según los detalles publicados hace que Midjourney V5 sea menos subjetivo en su comprensión de las indicaciones. «Los detalles tienen más probabilidad de ser correcto y habra menos texto no deseoado», se explica en esa información.

Los buenos avisos importantes más que nunca. Los creadores de Midjourney revelan que la nueva versión es especialmente sensible a las entradas de texto, por lo que más que nunca lo importante es ser muy concreto con lo que queremos y dar el máximo detalle posible para no encontrarnos con decepciones. Los prompts cortos no pueden funcionar tan bien como antes duedo a esto.

Mejor entrenado. Midjourney V5 es el segundo modelo entrenado con el supercúmulo de IA de sus creadores y lleva cinco meses en desarrollo. Sus responsables afirman que usa arquitecturas de redes neuronales «significativamente diferentes» y nuevas técnicas estéticas.

Manos al fin (casi) realistas. Otro de los avances que se parece haber logrado —aunque los responsables no se mencionan específicamente— es el de las manos que aparecen en las imágenes generadas, y que mejoran mucho: suelen contar con los cinco dedos bien representados, por ejemplo. Es cierto que Midjourney V5 sigue cometiendo errores en algunas imágenes desafiantes, pero el progreso es notable en este sentido.

Esto no es el final. Aún así, destacan, «este no es el paso final». Eso deja claro que la evolucion de Midjourney sigue su marcha imparable junto al de otras plataformas como Stable Diffusion o DALL-E 2. Mientras todas estas plataformas avanzan, eso sí, seguimos esperando al «Midjourney del vídeo», que por el momento parece resistirse a aparecer

Imagen: activista del carisma





Fuente