Google DeepMind lanzó este martes un nuevo modelo de generación de imágenes por inteligencia artificial denominado Gemini Imagen 2 Lite, diseñado para flujos de trabajo de alto volumen que priorizan velocidad y costo por sobre la calidad máxima. La herramienta está disponible desde hoy en Google AI Studio, la API de Gemini y la plataforma Gemini Enterprise Agent.

El nuevo modelo puede producir una imagen a partir de un texto en aproximadamente 4 segundos en su modo de procesamiento estándar, frente a los cerca de 20 segundos que demanda la versión anterior, Imagen 2. Google lo presenta como un reemplazo del Imagen original —que pasa a ser catalogado como "modelo heredado"— y lo posiciona en la parte baja de una familia que también incluye el Imagen 2, descrito como un "motor generalista", y el Imagen Pro, orientado a casos de uso avanzados.

Precio y rendimiento

En términos de costo, el modelo se ofrece a un promedio de 0,034 dólares por cada 1.000 imágenes generadas vía API. Las tarifas por tokens son de 0,25 dólares por millón de tokens de entrada y 1,50 dólares por millón de tokens de salida, exactamente la mitad de lo que cobra Imagen 2. El modelo Pro, en comparación, tiene un precio de salida de 12 dólares por millón de tokens, ocho veces más caro.

La empresa publicó puntuaciones Elo provenientes de Arena.ai para respaldar la calidad del modelo, que muestran que los usuarios califican los resultados de Imagen 2 Lite casi tan alto como los de las versiones no Lite. Sin embargo, el propio Google advierte sobre limitaciones concretas: el modelo tiene más dificultades con texto pequeño, las infografías pueden incluir datos incorrectos y la consistencia de personajes y personas puede variar entre generaciones sucesivas.

Contexto más amplio

El lanzamiento se produce en un momento en que la industria debate el impacto de los modelos de IA generativa sobre la producción creativa. A pesar de las críticas de sectores artísticos y de parte del público frente al denominado "AI slop" —imágenes de baja calidad producidas masivamente por IA—, las grandes tecnológicas continúan invirtiendo en estas herramientas. Google, en particular, comercializa sus modelos como asistentes para la creación de piezas publicitarias.

En ese marco, la compañía también anunció este martes la disponibilidad general de Gemini Omni Flash, un modelo de generación de video que fue presentado inicialmente en Google I/O y que tiene un costo de 0,10 dólares por segundo de video generado. Junto a ello, Google mostró una aplicación demo llamada Omni Product Studio, que combina la generación de imágenes estáticas con la producción de videos de estilo cinematográfico para comercio electrónico.

Días antes, Google había anunciado un acuerdo de 75 millones de dólares con el estudio independiente de cine A24, una asociación que generó críticas entre seguidores de la productora por su vínculo con la industria de la inteligencia artificial.