
Google ha dado un nuevo paso en su carrera por la inteligencia artificial. Según la fuente, Gemini 3.5 Flash acaba de incorporar de forma nativa la función Computer Use, una herramienta que permite crear agentes de IA capaces de ver, razonar y ejecutar acciones por su cuenta en un navegador, un móvil o un ordenador. Hasta ahora esta capacidad vivía en un modelo aparte, pero la compañía ha decidido integrarla directamente en su modelo de lenguaje más reciente, lo que simplifica bastante las cosas para quienes desarrollan aplicaciones con IA.
Qué cambia con la llegada de Computer Use a Gemini 3.5 Flash
De acuerdo con la información facilitada, Google se aleja así del enfoque que mantenía con Gemini 2.5 Computer Use, que era un modelo independiente pensado únicamente para esta tarea. A partir de ahora, los desarrolladores pueden apostar directamente por Gemini 3.5 Flash cuando quieran construir herramientas que aprovechen esta función, sin necesidad de combinar varios modelos distintos.
Según explica la compañía, esta integración nativa facilita mucho la automatización de tareas cotidianas. Un ejemplo sencillo: se pueden crear agentes capaces de analizar lo que aparece en una app móvil y, a partir de ahí, generar un desglose completo de sus funciones, algo que antes requería mucho más trabajo manual.
Para qué sirve realmente esta función, según Google
La empresa sostiene que Computer Use resulta especialmente útil en el terreno de las pruebas continuas de software, un proceso que suele consumir muchísimo tiempo a los equipos de desarrollo. Al automatizar la interacción con las interfaces, los agentes pueden detectar errores o comprobar funcionalidades sin que haga falta supervisión humana constante en cada paso.
Además, según los datos facilitados por Google, esta herramienta también puede emplearse para generar documentación técnica a partir del análisis detallado de una plataforma, así como para tareas relacionadas con la gestión y organización del conocimiento dentro de una empresa. Son usos que, hasta ahora, dependían en buena parte del trabajo manual de equipos especializados.
La seguridad, un punto clave en este tipo de agentes
Cualquier herramienta capaz de interactuar de forma autónoma con interfaces gráficas despierta, lógicamente, ciertas dudas en materia de seguridad. Según la fuente, este tipo de desarrollos suelen estar en el punto de mira de actores maliciosos, y los ataques mediante inyecciones de prompts o inyecciones de portapapeles son bastante habituales en este campo todavía en construcción.
Por ese motivo, Google asegura haber reforzado las medidas de protección, sobre todo pensando en su adopción dentro del entorno empresarial, donde un fallo de este tipo podría tener consecuencias más serias para una organización.
Las salvaguardias opcionales que ofrece Computer Use
Según indican desde la compañía, Computer Use en Gemini 3.5 Flash cuenta con salvaguardias de seguridad opcionales que los desarrolladores pueden activar según el caso de uso. Estas se encargan, por ejemplo, de pedir una confirmación explícita al usuario antes de ejecutar una acción considerada sensible o potencialmente irreversible, como podría ser realizar un pago o borrar información.
De acuerdo con la fuente, estas mismas salvaguardias también permiten frenar automáticamente cualquier tarea en marcha si el sistema detecta indicios de que está siendo víctima indirecta de una inyección de prompts. Es una capa extra de control que busca dar más confianza tanto a empresas como a usuarios particulares.
- Confirmación obligatoria antes de acciones sensibles o irreversibles.
- Detección y bloqueo automático ante posibles inyecciones de prompts.
- Activación opcional, según las necesidades de cada desarrollo.
El contexto: un modelo que ya pisaba fuerte en programación y agentes
Gemini 3.5 Flash se presentó en mayo, durante la conferencia I/O de Google, y desde entonces se había hecho notar por su buen desempeño en tareas de programación y en la creación de agentes de inteligencia artificial. Con la llegada de Computer Use, este apartado da un salto adicional, ya que ahora el propio modelo puede encargarse de ejecutar acciones, no solo de planificarlas o describirlas.
Según los datos facilitados por la compañía, en la actualidad Gemini 3.5 Flash es el modelo de referencia para las tareas generales dentro de la app de Gemini, donde convive junto a otras versiones como 3.1 Flash-Lite y 3.1 Pro, pensadas para distintos niveles de exigencia y velocidad.
Por qué esta novedad importa para desarrolladores y empresas
Más allá del anuncio técnico, esta actualización tiene implicaciones prácticas claras. Al integrar Computer Use directamente en un modelo de uso general, Google simplifica el trabajo de quienes hasta ahora tenían que combinar herramientas distintas para lograr resultados similares, lo que en la práctica puede traducirse en desarrollos más rápidos y agentes más versátiles.
Según la fuente, este movimiento también refleja una tendencia más amplia en el sector: la de modelos cada vez más capaces de actuar directamente sobre interfaces digitales, en lugar de limitarse a generar texto o responder preguntas. Será interesante ver cómo evoluciona la adopción de esta función en los próximos meses, especialmente en entornos empresariales donde la seguridad es una prioridad.
Fuente: https://ai.google.dev/gemini-api/docs/whats-new-gemini-3.5?hl=es-419