Google Presenta Gemini Omni, Su Nueva Familia De Modelos De IA Para Crear Vídeos Desde Texto, Imágenes Y Audio

Google ha anunciado Gemini Omni, una nueva familia de modelos de inteligencia artificial centrada en la creación y edición de contenido audiovisual. Según la compañía, esta tecnología permitirá generar vídeos a partir de texto, imágenes, clips ya existentes e incluso audio, todo dentro del ecosistema Gemini. El primer modelo presentado es Gemini Omni Flash, una herramienta que, de acuerdo con la fuente, busca simplificar la producción de vídeo mediante instrucciones conversacionales y edición directa desde chat.

Índice de contenidos

Gemini Omni quiere unificar la creación multimedia con IA

Según ha explicado Google en su blog oficial, Gemini Omni nace como una familia de modelos multimodales capaces de trabajar con distintos tipos de contenido al mismo tiempo. Esto significa que el sistema puede interpretar texto, imágenes, audio y vídeo de manera conjunta para producir nuevas piezas audiovisuales con contexto y coherencia.

La compañía asegura que el objetivo es avanzar hacia una IA capaz de “crear cualquier cosa desde cualquier entrada”. Gemini Omni Flash, el primer integrante de esta nueva línea, ya permite generar clips de vídeo acompañados de audio usando diferentes formatos de origen. Según los datos facilitados por Google, esta tecnología también podrá reutilizar vídeos existentes para modificarlos mediante instrucciones escritas.

El anuncio se ha realizado durante el evento Google I/O 2026, donde la empresa ha centrado gran parte de sus novedades en inteligencia artificial generativa. De acuerdo con distintos medios especializados, Gemini Omni representa uno de los lanzamientos más ambiciosos de la compañía en el ámbito creativo.

La herramienta permitirá editar vídeos directamente desde el chat

Uno de los aspectos más destacados del anuncio es la posibilidad de editar vídeos conversando con la IA. Según la información publicada por Google, los usuarios podrán cambiar fondos, modificar ángulos de cámara, añadir objetos o transformar escenas usando instrucciones naturales dentro del propio chat de Gemini.

La compañía también afirma que el modelo aprovecha el conocimiento contextual de Gemini para ofrecer resultados más coherentes. Esto permitiría generar clips con referencias culturales, históricas o visuales más precisas, aunque Google no ha detallado todavía el alcance real de estas capacidades en escenarios complejos.

De acuerdo con la fuente, Gemini Omni Flash puede generar actualmente clips de hasta 10 segundos con vídeo y audio integrados. Google ya ha adelantado que trabaja para ampliar esa duración en futuras versiones.

“Create anything from any input”, es una de las frases utilizadas por Google para resumir la filosofía detrás de Gemini Omni, según recoge la presentación oficial.

Google integrará Gemini Omni en Gemini, Flow y YouTube Shorts

Google ha confirmado que Gemini Omni Flash comienza a desplegarse desde hoy para usuarios de los planes Google AI Plus, Pro y Ultra. Según la empresa, estará disponible tanto en la app de Gemini como en Google Flow, su plataforma orientada a flujos creativos y generación multimedia.

Además, la compañía también llevará esta tecnología a YouTube Shorts y YouTube Create. Según los datos facilitados, la integración en estas plataformas comenzará durante esta misma semana y permitirá crear o modificar vídeos directamente desde herramientas utilizadas por creadores de contenido.

Google asegura que el acceso para desarrolladores y empresas llegará “en las próximas semanas” mediante APIs. La intención de la compañía es ampliar el uso de Gemini Omni a aplicaciones externas y herramientas profesionales.

Generación de vídeo desde texto
Edición conversacional de clips
Compatibilidad con imágenes, audio y vídeo
Integración en YouTube Shorts
Disponibilidad para desarrolladores vía API

La competencia en vídeo generativo sigue creciendo

El lanzamiento llega en un momento en el que la competencia entre plataformas de IA generativa se ha intensificado. Empresas como OpenAI, Runway, Pika o firmas chinas especializadas en vídeo generado por IA llevan meses acelerando el desarrollo de modelos audiovisuales.

Según varios análisis publicados tras el evento Google I/O, la compañía busca reforzar su posición frente al avance de herramientas rivales centradas en generación multimedia. Gemini Omni pretende diferenciarse mediante su enfoque multimodal, integrando varias capacidades dentro de un mismo sistema.

Google también insiste en que el modelo aprovecha la infraestructura y el conocimiento de Gemini para aportar mayor comprensión contextual. De acuerdo con la fuente, esto permitiría obtener resultados más consistentes que los generados por modelos aislados especializados únicamente en vídeo.

El contenido generado incluirá medidas de identificación

Otro punto importante del anuncio tiene que ver con la identificación del contenido generado mediante IA. Google ha confirmado que todos los vídeos creados con Gemini Omni incluirán SynthID, la tecnología de marca de agua invisible desarrollada por la compañía.

Según la empresa, esta herramienta servirá para identificar contenido generado artificialmente y mejorar la transparencia. Google también ha señalado que servicios como Chrome o Search podrán reconocer este tipo de marcas para ofrecer contexto adicional a los usuarios.

La compañía lleva meses reforzando este tipo de medidas debido al crecimiento de los contenidos sintéticos en internet. La expansión del vídeo generado por IA está aumentando el debate sobre autenticidad, desinformación y trazabilidad de contenidos digitales.

Google acelera su apuesta por la inteligencia artificial

Gemini Omni forma parte de una estrategia mucho más amplia de Google alrededor de la IA. Durante Google I/O 2026, la compañía también ha presentado nuevas versiones de Gemini, funciones agentic para Search y cambios importantes en Android y Workspace.

Según datos compartidos por la empresa, Gemini ya supera los 900 millones de usuarios mensuales. Google considera que la inteligencia artificial será el eje principal de sus productos durante los próximos años.

El lanzamiento de Gemini Omni refleja además el interés creciente de las grandes tecnológicas por convertir la IA generativa en herramientas creativas de uso cotidiano. La edición de vídeo mediante instrucciones naturales podría convertirse en una de las áreas con más crecimiento dentro del sector tecnológico durante los próximos meses.

Por ahora, Google no ha detallado cuándo llegará la versión gratuita completa de Gemini Omni fuera de YouTube Shorts y YouTube Create. La compañía sí ha confirmado que seguirá ampliando funciones y disponibilidad a medida que avance el despliegue global del modelo.

Google presenta Gemini Omni, su nueva familia de modelos de IA para crear vídeos desde texto, imágenes y audio