Google ha decidido presentar IMAGEN, su nueva IA capaz de crear imágenes ultra realistas a partir de una breve descripción. Una alternativa a la herramienta de OpenAI que, según las pruebas y las investigaciones de Google, consigue unos resultados más precisos.
DALL-E 2 prometió liberar su herramienta este verano a más usuarios, pero Google se ha adelantado y ha presentado IMAGEN como una investigación, el argumento de Google fue que por motivos éticos, IMAGE debe seguir sin ser un producto comercial y mantenerlo como una herramienta para académicos y expertos.
Llevando el foto realismo con IA a nuevos límites
Tanto IMAGEN como DALL-E 2 son parecidos en funcionamiento. La IA de ambas convierte un pequeño texto o una frase corta en una imagen detallada que coincide con lo descrito. Las combinaciones son casi ilimitadas y casi en todas las ocasiones, DALL-E 2 logra una imagen muy parecida a lo que se le pide. Google con su herramienta IMAGE, asegura haber resuelto algunas de las lagunas de OpenAI y ha conseguido generar imágenes apegadas a los textos descritos.
IMAGEN esta basada en el modelo Transformer T5, presentado en 2020. Originalmente la IA produce imágenes de 64 x 64 píxeles, para luego ser escaladas a 1.024 x 1.024 píxeles. La misma resolución con la que trabaja DALL-E 2. Esta idea de escalado es la que permite aliviar la potencia de cálculo y permitir la generación de imágenes en pocos segundos.
Para comparar qué IA es la que logra el mejor resultado en imágenes, Google ha creado el benchmark ‘DrawBench’. Según los resultados mostrados por el paper, la IA de Google cometió menos errores de comprensión a la hora de construir la imagen. Un ejemplo lo ponen con «Un panda haciendo latte art». La IA de Google entendió que era el animal quien debía realizar la acción, mientras que DALL-E 2 puso directamente un café con la cara de un panda.
Jeff Dean, VP de Google AI, publico en su perfil de Twitter algunos ejemplos de lo que es capaz de realizar IMAGEN.
El inconveniente que aun tiene Google es la preocupación por los malos usos de esta IA, algo que también ocurre con DALL-E 2, y es por ello que ha decidido no ponerla a disposición de los usuarios, por el momento. Pese a todo, es fascinante comprobar cómo la IA está mejorando poco a poco. Al ritmo que van tales herramientas, no podemos imaginar lo que podremos lograr dentro de unos años.