
Google ha anunciado el lanzamiento de Gemini 3.5 Live Translate, un nuevo modelo de inteligencia artificial orientado a la traducción de voz en tiempo real. Según la compañía, esta tecnología permite traducir conversaciones habladas de forma casi instantánea en más de 70 idiomas, con el objetivo de facilitar la comunicación entre personas que no comparten la misma lengua. La novedad llega como una evolución de las capacidades de traducción de la firma y comenzará a integrarse tanto en productos propios como en herramientas para empresas y desarrolladores.
Un modelo diseñado para traducir conversaciones mientras suceden
De acuerdo con la información facilitada por Google, Gemini 3.5 Live Translate es un modelo de audio capaz de procesar el habla de manera continua y generar traducciones sin necesidad de esperar a que el interlocutor termine una frase completa. La compañía asegura que este enfoque permite mantener conversaciones más fluidas y naturales.
Según la fuente, el sistema puede detectar automáticamente varios idiomas y ofrecer respuestas traducidas con baja latencia. Además, la empresa sostiene que la tecnología intenta conservar elementos como la entonación, el ritmo y la forma de hablar de cada persona para que la experiencia resulte más cercana a una conversación real.
La presentación de esta herramienta se produce en un momento en el que las soluciones de inteligencia artificial están ampliando su presencia en aplicaciones de productividad, videollamadas y comunicación internacional. La traducción instantánea se ha convertido en uno de los usos más visibles de esta tecnología para usuarios y empresas.
Más de 70 idiomas y miles de combinaciones posibles
Uno de los datos destacados por Google es que el modelo puede trabajar con más de 70 idiomas. Según la compañía, esto permite cubrir más de 2.000 combinaciones lingüísticas, ampliando considerablemente las posibilidades frente a sistemas anteriores.
La empresa señala que la nueva solución elimina algunas limitaciones que existían en servicios de traducción centrados principalmente en el inglés. Según los datos compartidos por la fuente, las conversaciones podrán realizarse entre numerosos pares de idiomas sin necesidad de utilizar una lengua intermedia.
Entre las capacidades mencionadas por Google se encuentran:
- Detección automática del idioma hablado.
- Traducción continua de voz a voz.
- Compatibilidad con más de 70 idiomas.
- Baja latencia durante la conversación.
- Preservación de matices como el tono y el ritmo del hablante.
Las primeras pruebas ya se realizan con empresas colaboradoras
Google también ha compartido algunos ejemplos de uso de Gemini 3.5 Live Translate en entornos empresariales. Según la compañía, la plataforma de movilidad Grab está probando esta tecnología para facilitar la comunicación entre conductores y viajeros que hablan idiomas diferentes.
De acuerdo con los datos facilitados por la empresa, los usuarios de Grab realizan más de 10 millones de llamadas de voz al mes dentro de la aplicación. La integración de traducción automática en tiempo real podría ayudar a reducir barreras lingüísticas durante recogidas, trayectos o consultas de servicio.
La compañía también menciona colaboraciones y pruebas con organizaciones como CJ ENM, LiveKit, Vision Agents, Software Mansion y Agora. Según las valoraciones compartidas por estos socios, las primeras pruebas han destacado aspectos como la velocidad de respuesta, la precisión de las traducciones y la capacidad de trabajar con varios idiomas.
Google Meet será uno de los primeros servicios en recibir la tecnología
Otro de los anuncios realizados por Google afecta a Google Meet. Según la compañía, el servicio de videollamadas incorporará próximamente las capacidades de Gemini 3.5 Live Translate para mejorar las conversaciones entre participantes de diferentes países.
La empresa explica que la traducción de voz en Meet pasará de admitir un número reducido de idiomas a ofrecer soporte para más de 70. Además, según la información difundida, las reuniones podrán gestionarse entre miles de combinaciones lingüísticas diferentes, sin depender exclusivamente de traducciones hacia o desde el inglés.
Google asegura que también se renovará la interfaz para ofrecer un acceso más rápido a estas funciones durante las videoconferencias. Según la compañía, el despliegue comenzará este mismo mes mediante una vista previa privada para determinados clientes empresariales de Google Workspace.
Una apuesta por integrar la traducción en productos y APIs
Más allá de las aplicaciones para usuarios finales, Google ha confirmado que Gemini 3.5 Live Translate estará disponible para desarrolladores a través de sus herramientas de inteligencia artificial. Según la empresa, esto permitirá crear nuevas experiencias de traducción en aplicaciones, servicios de atención al cliente y plataformas de comunicación.
De acuerdo con la documentación técnica compartida por la compañía, el modelo está diseñado para gestionar flujos continuos de audio y responder con traducciones habladas en tiempo real. La intención, según la fuente, es facilitar la creación de productos capaces de romper barreras idiomáticas sin interrumpir el ritmo de la conversación.
Google recuerda que lleva años trabajando en tecnologías de traducción automática y destaca que actualmente se traducen más de un billón de palabras cada mes a través de sus diferentes servicios. Según la empresa, Gemini 3.5 Live Translate representa un nuevo paso dentro de esa estrategia de integración de la inteligencia artificial en herramientas de uso cotidiano.
Qué supone este lanzamiento para los usuarios
La llegada de Gemini 3.5 Live Translate refuerza la tendencia de incorporar traducción en tiempo real basada en inteligencia artificial a aplicaciones de comunicación, reuniones y movilidad. Según la compañía, el objetivo es que las personas puedan hablar de forma natural mientras la tecnología se encarga de eliminar las barreras lingüísticas.
Por el momento, Google no ha detallado un calendario completo para todas las plataformas, aunque sí ha confirmado que la tecnología comenzará a desplegarse progresivamente en distintos productos. Según la información publicada por la empresa, las primeras integraciones se centrarán en herramientas de comunicación, videollamadas y desarrollo de aplicaciones.
Con esta presentación, Google amplía su apuesta por Gemini y por los modelos especializados en audio. Según la compañía, la combinación de traducción instantánea, reconocimiento automático de idiomas y conservación de la voz original busca acercar la comunicación global a un entorno cada vez más natural y accesible.
Fuente: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate