Así es Party, la nueva inteligencia artificial de Google para crear imágenes fotorrealistas


La inteligencia artificial promete marcar una hormiga y un desprecio en muchos ámbitos, pero uno en particular es donde está todo el protagonismo este año. En abril discutimos las enormes posibilidades de DALL-E 2, una capa IA de generar imágenes a partir de un texto. El más popular es DALL-E Mini, un generador que nos sorprende con sus delirantes creaciones. Ahora es el turno de Parti, una alternativa que apela a un nuevo y prometedor modelo para generar imágenes fotorrealistas.

A diferencia de DALL-E y sus variantes, que utilizan un modelo de generación de imágenes a partir de texto de «difusión», Parti (Pathways Autoregressive Text-to-Image) admite un modelo autorregresivo que permite entradas de texto más extensas y capacidad de hacer Composiciones complejas. Como podemos ver en la imagen distorsionada, los resultados de la Fiesta parecen más una obra de arte que las figuras amorfas como las que llamamos DALL-E Mini (imagen siguiente).

Dall E Mini

Imágenes generadas con Dall-E Mini

El nuevo generador de imágenes de Google

Los investigadores de Google encontraron en una publicación de blog que intenta Party en cuatro escalas (350M, 750M, 3B y 20B) con diferentes parámetros, es decir, con diferentes entradas de texto. A través de la prueba, descubriremos que la escala soberana última, específicamente en las indicaciones que sus abstracciones, requiere conocimiento del mundo, perspectivas específicas y representación de símbolos.

googe parte 3
googe parte 3

Imágenes generadas con Parti

En uno de los intentos, utilizó el siguiente texto de entrada: «Un mapa de los Estados Unidos hecho de sushi. Está sobre una mesa junto a una copa de vino tinto (Un mapa de Estados Unidos hecho con sushi. Es en un mes en el estante de una copa de tinta de vino.) «. un resultado espectacular en la 20B.

También realizaremos una prueba en la que los investigadores evaluarán el trabajo de Parti en diferentes escenarios complejos. Ingresaron el texto «Retrato de un tigre con sombrero de conductor de tren y sosteniendo una patineta que tiene un símbolo de yin-yang (Retiro de un tigre con un número de conductor de tren que sostiene una pátina con un símbolo de yin-yang)«.

parte 12
parte 12

Imágenes generadas con Parti

Existen diversas variantes en fotografía, ilustración de historias, pintura al óleo, estatua de mármol, entre otras. Sorprendentemente, la IA demostró su capacidad para adherirse a formatos y estilos de imagen específicos, aunque no siempre con buenos resultados. “Si bien Parti produce resultados de alta calidad para una amplia gama de indicaciones, el modelo, sin vergüenza, tiene muchas limitaciones”, indicó Google.

Europa abraza la Inteligencia Artificial: así es el pionero que explora (y limita) sus posibilidades

El gigante de Mountain View seguirá entrenando y mejorando sus modelos de inteligencia artificial para «aumentar la creatividad y productividad humana». Cabe señala que por motivos de seguridad (Google nos evita los malos), Parti no está disponible para el público, como lo es DALL-E Mini, porque podemos crear nuestras propias imágenes a partir de texto. Sin embargo, brindaremos la alternativa de tener una gran cantidad de ejemplos en la página del proyecto y consultar la investigación completa.

Y Xataka | El primer nivel de inteligencia artificial es bastante imparcial. Malas (y buenas) noticias para la justicia



Fuente