Google lanza Veo 3 e Imagen 4: sus nuevos modelos de IA para vídeo e imagen

Google lanza Veo 3 e Imagen 4: sus nuevos modelos de IA para vídeo e imagen 2

Google ha dado un nuevo paso en la carrera por liderar la inteligencia artificial creativa con el lanzamiento de Veo 3 e Imagen 4, sus modelos más avanzados para generar vídeos e imágenes a partir de texto. Estos avances, presentados en el evento Google I/O 2025, prometen elevar el nivel de realismo, detalle y control en la creación visual generada por IA.

Veo 3 promete vídeos más realistas con audio incluido y mejor física

Según lo anunciado por la compañía, Veo 3 incorpora mejoras significativas en la física del mundo real, como los movimientos de cámara más naturales y una sincronización labial más precisa en los personajes generados por IA.

Además, una de las novedades más destacadas es que ahora los vídeos creados con Veo 3 incluyen sonidos ambientales. Esto significa que el sistema puede agregar desde ruidos de tráfico hasta diálogos entre personajes, lo que permite crear escenas mucho más envolventes.

Google ha compartido clips de ejemplo para mostrar el potencial de Veo 3, como uno titulado “Old Sailor”, donde se aprecia un nivel de detalle que hace olvidar los típicos errores de versiones anteriores, como las manos deformes o los fondos difusos.

Eso sí, este avance tiene su precio. Veo 3 solo está disponible para suscriptores del plan AI Ultra, que cuesta 250 dólares al mes. Para quienes usan el plan AI Pro, más económico, seguirán accediendo a Veo 2, que también ha recibido mejoras importantes.

Veo 2 también evoluciona con más control y opciones de edición

Para quienes no puedan o no quieran pagar el plan más caro, Veo 2 sigue siendo una opción poderosa. Según Google, ahora ofrece más control sobre la consistencia visual de los clips y permite mejores movimientos de cámara, así como la posibilidad de ampliar la vista de una escena (lo que se conoce como outpainting).

Otra novedad relevante es que Veo 2 ahora puede añadir o eliminar objetos dentro del vídeo, lo que abre la puerta a una edición más personalizada sin salir del entorno de generación automática.

Estas funciones apuntan a facilitar la vida de creadores de contenido, publicistas y cineastas que buscan prototipar ideas rápidamente, sin necesidad de contar con grandes equipos de producción.

Google no ha especificado cuántas generaciones están permitidas por usuario, pero sí aclara que las limitaciones dependen de la demanda sobre su infraestructura de IA.

Imagen 4 lleva la generación de imágenes a un nuevo nivel

En el terreno de las imágenes, Google presentó Imagen 4, sucesor directo del modelo Imagen 3. Esta versión mejora notablemente la representación de texturas complejas como telas intrincadas, gotas de agua o pelaje de animales.

Además, permite generar imágenes en resoluciones de hasta 2K y en distintos formatos de aspecto, lo que ofrece mayor versatilidad para usos creativos, desde campañas gráficas hasta ilustraciones editoriales.

Una de las mejoras más esperadas es la calidad en la tipografía. Imagen 4 logra representar letras y palabras de forma mucho más coherente, evitando errores habituales como símbolos deformados o errores de ortografía generados por IA.

La herramienta ya está disponible en la aplicación Gemini de Google, y aunque no se han detallado límites concretos de uso, se espera que los usuarios gratuitos tengan restricciones similares a las de Imagen 3.

Flow: la herramienta que une texto, vídeo e imagen en una narrativa completa

Google también presentó Flow, una solución pensada para facilitar la creación de vídeos narrativos consistentes. Utiliza modelos de IA para mantener personajes, escenarios y estilo a lo largo de distintas escenas.

Esta herramienta puede ser muy útil para creadores de contenido, estudios de animación y equipos de marketing que necesiten producir vídeos rápidos con coherencia visual y narrativa.

Flow está disponible para usuarios con planes AI Pro y AI Ultra, aunque con ventajas adicionales en el plan más avanzado, como límites de uso más amplios y acceso a modelos más potentes.

En un entorno cada vez más dominado por la inteligencia artificial, Google apuesta fuerte por convertirse en un referente en la creación de contenido visual automatizado, y estas herramientas son una clara muestra de su ambición.

Fuente: https://www.theverge.com/news/670181/google-deepmind-ai-videos-app-flow-veo-3-2-imagen-4-io-2025


También podría ser de tu interés:

Deja un comentario