{"id":129666,"date":"2025-10-09T11:26:05","date_gmt":"2025-10-09T09:26:05","guid":{"rendered":"https:\/\/quondos.com\/mag\/?p=129666"},"modified":"2025-10-09T11:26:06","modified_gmt":"2025-10-09T09:26:06","slug":"gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles","status":"publish","type":"post","link":"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/","title":{"rendered":"Gemini 2.5 Computer Use, el modelo de Google que revoluciona el control inteligente en navegadores y apps m\u00f3viles"},"content":{"rendered":"\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"577\" src=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2025\/10\/CTU_2096x1182_RD6-V01.width-1200-1024x577.webp\" alt=\"\" class=\"wp-image-129667\" title=\"\" srcset=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2025\/10\/CTU_2096x1182_RD6-V01.width-1200-1024x577.webp 1024w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2025\/10\/CTU_2096x1182_RD6-V01.width-1200-300x169.webp 300w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2025\/10\/CTU_2096x1182_RD6-V01.width-1200-768x433.webp 768w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2025\/10\/CTU_2096x1182_RD6-V01.width-1200.webp 1200w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\nFuente: <p>Google ha lanzado una nueva funcionalidad que est\u00e1 revolucionando el desarrollo de agentes inteligentes, y seg\u00fan la fuente oficial, el nuevo modelo <strong>Gemini 2.5 Computer Use<\/strong> promete cambiar la manera en la que las IA interact\u00faan con interfaces gr\u00e1ficas y sistemas digitales. Este avance, anunciado por Google DeepMind, abre la puerta a una inteligencia artificial capaz de controlar navegadores web y aplicaciones m\u00f3viles con agilidad y precisi\u00f3n.<\/p>\u00a0<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_76 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice de contenidos<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/#Gemini_25_Computer_Use_lleva_la_IA_a_un_nuevo_nivel\" >Gemini 2.5 Computer Use lleva la IA a un nuevo nivel<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/#Funcionamiento_avanzado_en_entornos_digitales\" >Funcionamiento avanzado en entornos digitales<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/#Medidas_de_seguridad_integradas_en_Gemini_25\" >Medidas de seguridad integradas en Gemini 2.5<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/#Casos_de_uso_y_experiencias_de_los_primeros_testers\" >Casos de uso y experiencias de los primeros testers<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/#Disponibilidad_y_primeros_pasos_con_Gemini_25_Computer_Use\" >Disponibilidad y primeros pasos con Gemini 2.5 Computer Use<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Gemini_25_Computer_Use_lleva_la_IA_a_un_nuevo_nivel\"><\/span>Gemini 2.5 Computer Use lleva la IA a un nuevo nivel<span class=\"ez-toc-section-end\"><\/span><\/h2> <p>Seg\u00fan informes de Google, este modelo especializado se ha construido sobre la arquitectura <strong>Gemini 2.5 Pro<\/strong>, famosa por su capacidad de razonamiento visual. El resultado es una IA que <strong>supera a los principales competidores<\/strong> en benchmarks de control tanto en navegaci\u00f3n web como en aplicaciones m\u00f3viles, y que, adem\u00e1s, funciona con menor latencia, es decir, m\u00e1s r\u00e1pido que nunca.<\/p> <p>Una de las <strong>claves del nuevo modelo Gemini<\/strong> reside en su integraci\u00f3n a trav\u00e9s de la API en <a href=\"https:\/\/ai.google.com\/ai-studio\/\" target=\"_blank\" rel=\"noopener\">Google AI Studio<\/a> y Vertex AI, mediante el uso de una herramienta llamada <strong>computer_use<\/strong>. Este sistema permite a los desarrolladores controlar agentes que pueden interpretar solicitudes, analizar im\u00e1genes del entorno digital, y ejecutar acciones como hacer clic, escribir o interactuar con men\u00fas sin necesidad de programaci\u00f3n tradicional.<\/p> <p>La IA no se limita a tareas sencillas. Ahora puede rellenar formularios, manejar men\u00fas desplegables e, incluso, operar detr\u00e1s de p\u00e1ginas protegidas por inicio de sesi\u00f3n, lo que la convierte en un recurso valioso para <strong>automatizar procesos complejos<\/strong> y ahorrar tiempo en tareas repetitivas o manuales.<\/p>\u00a0<h2><span class=\"ez-toc-section\" id=\"Funcionamiento_avanzado_en_entornos_digitales\"><\/span>Funcionamiento avanzado en entornos digitales<span class=\"ez-toc-section-end\"><\/span><\/h2> <p>Seg\u00fan Google, el flujo de trabajo del modelo empieza con la entrada de la petici\u00f3n del usuario, una captura de pantalla del entorno y el historial de acciones recientes. El modelo analiza estos datos y genera una respuesta: normalmente una acci\u00f3n de interfaz como hacer clic o escribir, siempre velando por la seguridad y por <strong>evitar acciones no autorizadas<\/strong>.<\/p> <p>Tras ejecutar la acci\u00f3n, se env\u00eda una nueva captura de pantalla y la URL actual para continuar el bucle hasta que la tarea concluye. Este proceso iterativo permite <strong>automatizar tareas<\/strong> en el navegador e incluso en aplicaciones m\u00f3viles, aunque a\u00fan no est\u00e1 optimizado para sistemas operativos de escritorio.<\/p> <p>El potencial demostrado en pruebas internas y externas ha confirmado que <strong>Gemini 2.5 Computer Use<\/strong> es l\u00edder en precisi\u00f3n y velocidad, seg\u00fan informes que detallan su rendimiento en plataformas como Browserbase y <a href=\"https:\/\/github.com\/Open-Mind2Web\" target=\"_blank\" rel=\"noopener\">Online-Mind2Web<\/a>.<\/p>\u00a0<h2><span class=\"ez-toc-section\" id=\"Medidas_de_seguridad_integradas_en_Gemini_25\"><\/span>Medidas de seguridad integradas en Gemini 2.5<span class=\"ez-toc-section-end\"><\/span><\/h2> <p>La seguridad es fundamental. La fuente recalca que <strong>los agentes que controlan ordenadores presentan riesgos \u00fanicos<\/strong>, como el uso indebido intencionado, comportamientos inesperados y ataques mediante prompt injection. Por ello, la IA incorpora mecanismos que detectan y previenen acciones potencialmente peligrosas. Estos mecanismos van desde servicios externos de verificaci\u00f3n de cada paso, hasta directrices de sistema que pueden requerir <strong>confirmaci\u00f3n del usuario antes de ejecutar acciones delicadas<\/strong>, como compras o modificaciones cr\u00edticas.<\/p> <p>Adem\u00e1s, los desarrolladores tienen acceso a controles adicionales para limitar cualquier posibilidad de da\u00f1o, como la manipulaci\u00f3n de CAPTCHAs o la intervenci\u00f3n en dispositivos m\u00e9dicos, siguiendo las recomendaciones de <a href=\"https:\/\/cloud.google.com\/vertex-ai\/docs\" target=\"_blank\" rel=\"noopener\">Google Vertex AI<\/a> para entornos empresariales.<\/p> <p>La documentaci\u00f3n oficial incluye gu\u00edas para implementar buenas pr\u00e1cticas y realizar pruebas exhaustivas antes de poner cualquier sistema en marcha, destacando la responsabilidad como eje central en el despliegue de agentes inteligentes.<\/p>\u00a0<h2><span class=\"ez-toc-section\" id=\"Casos_de_uso_y_experiencias_de_los_primeros_testers\"><\/span>Casos de uso y experiencias de los primeros testers<span class=\"ez-toc-section-end\"><\/span><\/h2> <p>Google ya ha puesto este modelo en producci\u00f3n en varios de sus propios proyectos internos, como la automatizaci\u00f3n de pruebas de interfaz (UI testing), lo que est\u00e1 acelerando la creaci\u00f3n y validaci\u00f3n de software, especialmente en proyectos como Firebase Testing Agent y Project Mariner.<\/p> <p>Los usuarios del programa de acceso temprano han experimentado resultados s\u00f3lidos, tanto en el desarrollo de asistentes personales como en la <strong>automatizaci\u00f3n de flujos de trabajo digitales<\/strong>. Las opiniones compartidas en la comunidad de desarrolladores resaltan la capacidad del modelo para afrontar tareas complicadas y organizar informaci\u00f3n de manera eficiente, como se indica en demos p\u00fablicas que muestran casos de uso concretos \u2014por ejemplo, la gesti\u00f3n de notas en tableros virtuales o la administraci\u00f3n de citas en sistemas CRM de mascotas.<\/p> <p>La buena acogida y el impacto positivo en la productividad han hecho que <strong>muchos equipos adopten Gemini 2.5 Computer Use<\/strong> como complemento en sus pruebas y procesos internos.<\/p>\u00a0<h2><span class=\"ez-toc-section\" id=\"Disponibilidad_y_primeros_pasos_con_Gemini_25_Computer_Use\"><\/span>Disponibilidad y primeros pasos con Gemini 2.5 Computer Use<span class=\"ez-toc-section-end\"><\/span><\/h2> <p>Google anuncia que, desde hoy, el modelo est\u00e1 en <strong>public preview<\/strong> y disponible a trav\u00e9s de la <a href=\"https:\/\/ai.google.com\/ai-studio\/\" target=\"_blank\" rel=\"noopener\">Gemini API<\/a>. Los interesados pueden probarlo en el entorno de demostraci\u00f3n de Browserbase, empezar a construir bucles de agentes usando Playwright, o desplegar pruebas en la nube.<\/p> <p>La documentaci\u00f3n y la comunidad de desarrolladores est\u00e1n abiertas para quienes quieran aportar comentarios o sugerencias. Tanto empresas como usuarios individuales pueden <strong>sumarse al desarrollo<\/strong> de soluciones basadas en esta tecnolog\u00eda y guiar la evoluci\u00f3n de la hoja de ruta futura.<\/p>\n\n\n\n<p>Fuente: https:\/\/blog.google\/technology\/google-deepmind\/gemini-computer-use-model\/<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Fuente: Google ha lanzado una nueva funcionalidad que est\u00e1 revolucionando el desarrollo de agentes inteligentes, y seg\u00fan la fuente oficial, &#8230; <\/p>\n<p class=\"read-more-container\"><a title=\"Gemini 2.5 Computer Use, el modelo de Google que revoluciona el control inteligente en navegadores y apps m\u00f3viles\" class=\"read-more button\" href=\"https:\/\/quondos.com\/mag\/gemini-2-5-computer-use-el-modelo-de-google-que-revoluciona-el-control-inteligente-en-navegadores-y-apps-moviles\/#more-129666\" aria-label=\"Leer m\u00e1s sobre Gemini 2.5 Computer Use, el modelo de Google que revoluciona el control inteligente en navegadores y apps m\u00f3viles\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":850,"featured_media":129667,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1474],"tags":[],"class_list":["post-129666","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50","no-featured-image-padding"],"_links":{"self":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/129666","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/users\/850"}],"replies":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/comments?post=129666"}],"version-history":[{"count":1,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/129666\/revisions"}],"predecessor-version":[{"id":129668,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/129666\/revisions\/129668"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media\/129667"}],"wp:attachment":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media?parent=129666"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/categories?post=129666"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/tags?post=129666"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}