viernes, abril 19, 2024
spot_img
InicioGoogleIMAGEN, la nueva IA de Google para crear imágenes ultra realistas

IMAGEN, la nueva IA de Google para crear imágenes ultra realistas

Google ha decidido presentar IMAGEN, su nueva IA capaz de crear imágenes ultra realistas a partir de una breve descripción. Una alternativa a la herramienta de OpenAI que, según las pruebas y las investigaciones de Google, consigue unos resultados más precisos.

DALL-E 2 prometió liberar su herramienta este verano a más usuarios, pero Google se ha adelantado y ha presentado IMAGEN como una investigación, el argumento de Google fue que por motivos éticos, IMAGE debe seguir sin ser un producto comercial y mantenerlo como una herramienta para académicos y expertos.

Llevando el foto realismo con IA a nuevos límites

Tanto IMAGEN como DALL-E 2 son parecidos en funcionamiento. La IA de ambas convierte un pequeño texto o una frase corta en una imagen detallada que coincide con lo descrito. Las combinaciones son casi ilimitadas y casi en todas las ocasiones, DALL-E 2 logra una imagen muy parecida a lo que se le pide. Google con su herramienta IMAGE, asegura haber resuelto algunas de las lagunas de OpenAI y ha conseguido generar imágenes apegadas a los textos descritos.

IMAGEN esta basada en el modelo Transformer T5, presentado en 2020. Originalmente la IA produce imágenes de 64 x 64 píxeles, para luego ser escaladas a 1.024 x 1.024 píxeles. La misma resolución con la que trabaja DALL-E 2. Esta idea de escalado es la que permite aliviar la potencia de cálculo y permitir la generación de imágenes en pocos segundos.

Para comparar qué IA es la que logra el mejor resultado en imágenes, Google ha creado el benchmark ‘DrawBench’. Según los resultados mostrados por el paper, la IA de Google cometió menos errores de comprensión a la hora de construir la imagen. Un ejemplo lo ponen con “Un panda haciendo latte art”. La IA de Google entendió que era el animal quien debía realizar la acción, mientras que DALL-E 2 puso directamente un café con la cara de un panda.

Jeff Dean, VP de Google AI, publico en su perfil de Twitter algunos ejemplos de lo que es capaz de realizar IMAGEN.

El inconveniente que aun tiene Google es la preocupación por los malos usos de esta IA, algo que también ocurre con DALL-E 2, y es por ello que ha decidido no ponerla a disposición de los usuarios, por el momento. Pese a todo, es fascinante comprobar cómo la IA está mejorando poco a poco. Al ritmo que van tales herramientas, no podemos imaginar lo que podremos lograr dentro de unos años.

Xakata, Mixed N, Open-AI

Ernesto Mota
Ernesto Mota
Nací en el d.f., sigo siendo defeño, hoy radico en la hermosa ciudad de Cuernavaca, Morelos, soy Ing. en Sistemas computacionales, con un posgrado en Tecnologías de información, Doctorando en ambientes virtuales de aprendizaje y realidad aumentada, Tecnólogo es mi categoría laboral, y mi linea de investigación es la realidad aumentada aplicada a nuevos entornos de aprendizaje.
RELATED ARTICLES
- Advertisment -

Most Popular

Recent Comments