
Google ha presentado una versión mejorada de su agente de IA Gemini Deep Research, ahora accesible a través de la Interactions API para que los desarrolladores lo integren en sus aplicaciones. Según la compañía, este agente representa un avance significativo en capacidades de investigación autónoma, permitiendo tareas complejas de recopilación y síntesis de información. De esta forma, se posiciona como una herramienta clave para automatizar procesos en diversos sectores.
El agente optimiza la búsqueda profunda en la web
De acuerdo con la fuente, Gemini Deep Research utiliza el modelo Gemini 3 Pro, entrenado para minimizar alucinaciones y maximizar la calidad en informes complejos. El agente planifica investigaciones de forma iterativa: formula consultas, analiza resultados, detecta lagunas y busca de nuevo. Esto permite navegar por sitios web profundos en busca de datos específicos, según los datos facilitados por Google.
La compañía destaca que esta versión logra resultados de vanguardia en benchmarks como Humanity’s Last Exam (HLE) con un 46,4%, DeepSearchQA al 66,1% y BrowseComp al 59,2%. Además, genera informes bien investigados a un costo mucho menor, lo que lo hace más eficiente para usos prolongados.
DeepSearchQA mide la complejidad real de las investigaciones
Google ha abierto el código de DeepSearchQA, un nuevo benchmark para evaluar agentes en tareas de investigación web multi-paso. Según la nota, incluye 900 tareas en 17 campos que forman «cadenas causales», donde cada paso depende del anterior. A diferencia de pruebas simples de hechos, mide la exhaustividad al requerir respuestas completas.
De acuerdo con la fuente, este benchmark diagnostica el valor del «tiempo de pensamiento», mostrando mejoras al permitir más búsquedas y razonamientos. Los resultados comparan pass@8 versus pass@1, evidenciando beneficios de explorar trayectorias paralelas. Los desarrolladores pueden acceder al dataset, leaderboard y un Colab inicial para probarlo.
DeepSearchQA evalúa precisión en investigación y recall en recuperación, impulsando agentes más robustos.
Aplicaciones reales en finanzas y biotecnología
Empresas de servicios financieros usan Gemini Deep Research para automatizar due diligence inicial, según feedback temprano citado por la compañía. Agrupa señales de mercado, análisis de competidores y riesgos de cumplimiento de fuentes web y propietarias. Esto actúa como multiplicador de fuerza para equipos de inversión en fases preliminares.
En biotecnología, Axiom Bio emplea el agente para predecir toxicidad de fármacos con mayor profundidad en literatura biomédica, de acuerdo con la fuente. Acelera pipelines de descubrimiento de medicamentos resolviendo desafíos de seguridad complejos. Estos casos demuestran impacto inmediato en campos que demandan precisión alta.
- Automatización de investigación preliminar en finanzas.
- Análisis granular de literatura científica en biotech.
- Integración de datos web y documentos propietarios.
Características para desarrolladores en la Interactions API
Los creadores de herramientas de investigación pueden usar Gemini Deep Research para sintetizar información unificada, según Google. Analiza PDFs, CSVs y datos web públicos con File Upload y File Search Tool. Maneja contextos grandes directamente en prompts, facilitando informes detallados.
La fuente indica control total sobre salidas: estructura, headers, tablas y formato vía prompting. Proporciona citas granulares para verificar orígenes y soporta JSON schema para parsing fácil. Esto habilita aplicaciones downstream con resultados estructurados.
Próximos pasos y disponibilidad ampliada
Para empezar, los desarrolladores acceden a la Interactions API con su clave de Gemini API desde Google AI Studio, de acuerdo con la documentación. Futuras actualizaciones incluirán generación nativa de gráficos y soporte MCP para fuentes de datos personalizadas. Pronto llegará a Vertex AI para empresas.
Según la compañía, el agente se integrará en Google Search, NotebookLM, Google Finance y la app Gemini. Esto amplía su utilidad más allá de apps de terceros, potenciando herramientas cotidianas con investigación profunda. Los avances en RL multi-paso aseguran navegación precisa en paisajes informativos complejos.
Fuente: https://blog.google/technology/developers/deep-research-agent-gemini-api/