
Google acaba de anunciar el lanzamiento de dos nuevos modelos de inteligencia artificial generativa: Nano Banana 2 Lite y Gemini Omni Flash. Según la compañía, ambos están disponibles desde el 30 de junio de 2026 para desarrolladores a través de Google AI Studio, la API de Gemini y la Gemini Enterprise Agent Platform. El objetivo, de acuerdo con el blog oficial de Google, es facilitar la experimentación y el escalado de proyectos multimedia que combinen generación de imágenes y vídeo en un solo flujo de trabajo.
Nano Banana 2 Lite, el modelo de generación de imágenes más rápido y económico de Google hasta la fecha
Según los datos facilitados por Google, Nano Banana 2 Lite (identificado técnicamente como gemini-3.1-flash-lite-image) es el modelo de imagen más rápido y rentable dentro de la familia Nano Banana. La compañía lo presenta como la opción recomendada para sustituir a la versión anterior, Nano Banana (gemini-2.5-flash-image), con mejoras en calidad, velocidad y coste.
De acuerdo con la información publicada, el modelo es capaz de generar imágenes en apenas 4 segundos, lo que lo hace especialmente adecuado para prototipos interactivos y flujos de producción de alto volumen. En cuanto al precio, Google lo sitúa en 0,034 dólares por cada 1.000 imágenes, una cifra orientada a desarrolladores que priorizan la escalabilidad y el control del presupuesto operativo.
Según la compañía, a pesar de priorizar la velocidad, el modelo mantiene una buena adherencia a los prompts, consistencia en los personajes generados y texto legible dentro de las imágenes. Estos son tres de los puntos débiles habituales en los modelos de imagen rápidos, por lo que Google destaca este equilibrio como uno de sus principales valores.
La familia Nano Banana: tres modelos para distintas necesidades
Google ha aprovechado el lanzamiento para aclarar cómo se estructura la familia Nano Banana, que según sus datos incluye ahora tres modelos activos con perfiles diferenciados:
- Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image): Optimizado para velocidad y alto volumen. Ideal cuando la latencia ultrabaja es prioritaria.
- Nano Banana 2 (Gemini 3.1 Flash Image): El modelo «generalista». Según la compañía, ofrece el mejor equilibrio entre calidad, latencia y coste.
- Nano Banana Pro (Gemini 3 Pro Image): Diseñado para casos de uso profesionales y complejos, donde la precisión importa más que la velocidad.
La versión original, Nano Banana (Gemini 2.5 Flash Image), queda catalogada como modelo heredado. De acuerdo con Google, se recomienda a los desarrolladores que la están usando que migren a Nano Banana 2 Lite para obtener mejoras inmediatas en todos los parámetros de rendimiento.
Gemini Omni Flash llega a los desarrolladores con generación y edición de vídeo conversacional
El segundo gran lanzamiento de este anuncio es Gemini Omni Flash (gemini-omni-flash-preview), un modelo que, según Google, combina el razonamiento multimodal de Gemini con generación y edición de vídeo. Hasta ahora solo estaba disponible en la app Gemini y en Google Flow; a partir del 30 de junio de 2026 llega también a desarrolladores a través de Google AI Studio y la API de Gemini.
Según la información facilitada por la compañía, el precio se sitúa en 0,10 dólares por segundo de vídeo generado, la misma tarifa que Veo 3.1 Fast. Los vídeos generados tienen actualmente una duración máxima de 10 segundos, aunque Google apunta que duraciones más largas llegarán próximamente.
De acuerdo con Google, entre los puntos fuertes de Omni Flash destacan:
- Edición conversacional: Permite refinar y modificar vídeos usando lenguaje natural.
- Referencias multimodales: Admite combinar imágenes, texto y vídeo como entrada para mantener consistencia visual.
- Conocimiento del mundo real: Según la compañía, el modelo se apoya en el conocimiento de Gemini (historia, biología, narrativa) para construir vídeos más coherentes.
- Sincronización de texto y acción: Conecta gráficos y texto directamente con acciones dentro del vídeo mediante prompts sencillos.
Algunas limitaciones que Google reconoce en el lanzamiento
En la nota publicada en su blog, Google es transparente sobre las limitaciones actuales de Gemini Omni Flash. Por el momento, la duración máxima de los vídeos es de 10 segundos. Tampoco está soportada la carga de referencias de audio ni la extensión de escenas desde la API. Además, según la compañía, las referencias de vídeo de hasta 3 segundos son aceptadas por el esquema de la API pero no se procesan correctamente en este momento.
Google también reconoce que la consistencia de personajes al cambiar de escena o en movimientos de cámara tiene limitaciones, aunque indica que están trabajando para mejorarla. Este tipo de transparencia en el lanzamiento es poco habitual en la industria y puede resultar útil para los equipos de desarrollo que estén valorando integrar el modelo en sus proyectos.
Cómo combinar ambos modelos en un mismo flujo de trabajo
Uno de los aspectos más interesantes del anuncio es la posibilidad de encadenar Nano Banana 2 Lite y Gemini Omni Flash en un mismo pipeline. Según Google, el flujo básico sería: generar una imagen con Nano Banana 2 Lite y pasarla como referencia a Omni Flash para convertirla en vídeo. Además, usando la Interactions API, es posible mantener el historial de sesión y encadenar hasta tres ediciones secuenciales.
Para ayudar a los desarrolladores a empezar, Google ha publicado tres aplicaciones de demostración que ilustran este tipo de flujo combinado:
- Anywhere: Toma una foto o selfie y usa Nano Banana 2 Lite para transportarte visualmente a decenas de lugares icónicos. Al hacer clic en la imagen, Omni Flash la convierte en un clip animado.
- Space Lift: App de diseño de interiores que genera distintos conceptos decorativos a partir de una foto de habitación, y luego los anima con un vídeo cinematográfico usando Omni Flash.
- Omni Product Studio: Convierte imágenes estáticas generadas con Nano Banana 2 Lite en vídeos de producto para e-commerce usando Gemini Omni.
Seguridad y marcado de contenido generado por IA
Según Google, ambos modelos incorporan la tecnología SynthID, un sistema de marca de agua desarrollado por Google DeepMind para identificar contenido generado por inteligencia artificial. De acuerdo con la compañía, es posible verificar si un contenido fue creado por IA a través de la app Gemini, Gemini en Chrome o desde el propio buscador de Google.
Esta medida se enmarca en un esfuerzo más amplio que Google dice estar llevando a cabo para expandir sus herramientas de verificación de contenido en la web. En un contexto en el que la generación de imágenes y vídeos con IA se está masificando, el marcado invisible de los contenidos es uno de los mecanismos que la industria empieza a adoptar para mantener cierta trazabilidad sobre el origen de los medios digitales.
Dónde están disponibles los nuevos modelos de Gemini
Según los datos facilitados por Google, Nano Banana 2 Lite ya está disponible en Google AI Studio, la API de Gemini y la Gemini Enterprise Agent Platform. Además, la compañía indica que también se está desplegando en sus productos de consumo: AI Mode en Search, la app Gemini, NotebookLM, Google Photos, Stitch, Google Flow y Google Ads.
Por su parte, Gemini Omni Flash llega en vista previa pública a Google AI Studio y la API de Gemini desde el 30 de junio de 2026. También está disponible en la app Gemini y en Google Flow. Según Google, la documentación completa de ambos modelos, incluyendo guías de prompting y limitaciones regionales, puede consultarse en el portal para desarrolladores de la API de Gemini.
Fuente:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite