Google Actualiza Gemini Con Voz Personalizable Y Guía Visual: Así Cambia El Asistente De IA

La inteligencia artificial de Google sigue evolucionando. Con la última actualización de Gemini, el gigante tecnológico ha dado un salto notable al incorporar nuevas funciones que mejoran la interacción entre usuarios y su asistente de IA. Según la fuente oficial, esta versión introduce una experiencia más natural y visual, pensada para que hablar con Gemini se sienta cada vez más humano.

Índice de contenidos

Gemini Live y la revolución en las conversaciones

Según informes recientes, la herramienta conocida como Gemini Live ha sido actualizada para ofrecer una comunicación más fluida y realista. Ahora los usuarios pueden ajustar el tono, el acento e incluso la velocidad de respuesta del asistente. Esto significa que podrás decidir si quieres que te responda con un acento británico pausado o con el ritmo acelerado de una voz americana.

Esta función busca que la conversación con la IA sea más cercana, adaptándose al estilo de cada persona. Además, Google ha trabajado en la entonación y la naturalidad de las respuestas, logrando que Gemini reaccione con pausas y matices similares a los del habla humana. Según la compañía, el objetivo es que la experiencia sea tan cómoda como hablar con un amigo o colega.

Por el momento, Gemini Live está llegando progresivamente a los móviles Android compatibles. No hace falta hacer nada especial: la actualización se activa de forma automática si la aplicación está al día. Aun así, ciertas funciones avanzadas estarán disponibles solo para usuarios suscritos al plan Google AI Pro.

La nueva guía visual: Gemini también “ve”

Otra de las grandes novedades es la llegada de la guía visual en Gemini. Gracias a esta función, el asistente puede usar la cámara del móvil para identificar objetos dentro del entorno y ayudar al usuario a encontrarlos. Por ejemplo, si apuntas tu cámara a un cajón lleno de cosas y le preguntas dónde está tu llave, Gemini la reconocerá y resaltará en pantalla.

Según Google, esta herramienta aprovecha técnicas avanzadas de visión por computadora y aprendizaje profundo para procesar las imágenes en tiempo real sin comprometer la privacidad del usuario. La compañía asegura que los datos visuales no se almacenan en servidores, sino que se procesan localmente en el dispositivo.

La guía visual llega acompañada de mejoras en el procesamiento del lenguaje natural, haciendo posible la combinación de comandos hablados y visuales. Esto marca un paso adelante en la integración entre texto, voz e imagen, algo clave para el desarrollo de IA multimodal.

Cómo activar y usar las nuevas funciones

Para disfrutar de estas herramientas, basta con mantener la app de Gemini actualizada. Puedes hacerlo desde Google Play o, si usas iPhone, desde App Store. Una vez instalada la nueva versión, las funciones de voz y guía visual aparecen dentro del menú de ajustes de Gemini Live.

Google recomienda comprobar que el idioma y la región del dispositivo están configurados correctamente, ya que algunas funciones —como los acentos o las respuestas rápidas— están llegando por fases. Si no las ves todavía, podrían activarse en los próximos días.

En cualquier caso, el objetivo de la compañía es que estas innovaciones formen parte de la experiencia nativa del asistente sin necesidad de configuraciones complicadas, buscando que la interacción sea intuitiva y directa.

Una IA más humana y flexible

De acuerdo con la fuente, las mejoras introducidas en Gemini no solo apuntan a la comodidad, sino también a la accesibilidad. Las voces personalizables ayudarán a personas con diferentes necesidades auditivas o cognitivas, mientras que la guía visual amplía las posibilidades de apoyo en tareas cotidianas.

Expertos en tecnología señalan que este tipo de avances son los que diferencian a Gemini de otros asistentes como Siri o Alexa. En este sentido, Google parece apostar por una inteligencia artificial más empática y personalizada, con capacidad para adaptarse emocionalmente al usuario, según reportes de medios tecnológicos internacionales.

En conjunto, esta actualización no solo amplía las capacidades técnicas del asistente, sino que también refuerza la visión de Google sobre el futuro de la interacción hombre-máquina: un mundo donde las interfaces sean casi invisibles, y las conversaciones con la tecnología se sientan naturales, espontáneas y humanas.

Gemini 3.0 ya en el horizonte

Estas novedades llegan apenas unos días antes del esperado lanzamiento de Gemini 3.0, previsto para el 22 de octubre según filtraciones en medios especializados. Todo apunta a que esta nueva versión profundizará en el modo conversacional y traerá mejoras en rendimiento, contexto y personalización.

Con la llegada de Gemini 3.0, Google busca posicionarse como la herramienta de inteligencia artificial más completa del mercado, integrando voz, texto e imagen en una sola plataforma. La competencia con ChatGPT se intensifica, y esta actualización podría marcar el inicio de una nueva era en la comunicación asistida por IA.

Si quieres conocer más sobre las actualizaciones futuras y consejos para aprovechar al máximo las funciones de Gemini, puedes visitar la página oficial de Google Cloud, donde se detallan las opciones profesionales para desarrolladores y empresas.

Fuente: https://www.20minutos.es/tecnologia/inteligencia-artificial/ia-google-se-actualiza-conversar-contigo-segun-tu-estado-animo-emociones-asi-funciona_6529874_0.html

Google actualiza Gemini con voz personalizable y guía visual: así cambia el asistente de IA

Gemini Live y la revolución en las conversaciones

La nueva guía visual: Gemini también “ve”

Cómo activar y usar las nuevas funciones

Una IA más humana y flexible

Gemini 3.0 ya en el horizonte

Deja un comentario Cancelar la respuesta