Google lanza Gemini 3.5 Live Translate para traducción instantánea de voz
Permite conversaciones casi en tiempo real en más de 70 idiomas, manteniendo el tono y la naturalidad de la voz original
10.06.2026 09:46
Google anunció el lanzamiento de Gemini 3.5 Live Translate, una nueva tecnología de inteligencia artificial diseñada para realizar traducciones instantáneas de voz a voz con una latencia mínima y una calidad significativamente superior a la de generaciones anteriores.
La herramienta forma parte de la nueva familia de modelos Gemini 3.5 y busca acercar la traducción simultánea a una experiencia más natural, permitiendo conversaciones fluidas entre personas que hablan distintos idiomas.
Traducción en más de 70 idiomas
Según informó la compañía, Gemini 3.5 Live Translate puede detectar automáticamente más de 70 idiomas y traducir conversaciones en tiempo real con apenas unos segundos de retraso.
Una de las principales novedades es que el sistema conserva elementos esenciales del habla original, como la entonación, el ritmo y el tono de voz, lo que permite generar traducciones más naturales y menos robóticas.
Google sostiene que el modelo es capaz de seguir conversaciones cotidianas sin interrupciones significativas, acercándose cada vez más a una experiencia de interpretación simultánea.
Integración en aplicaciones y servicios
La nueva tecnología comenzará a desplegarse en diferentes productos del ecosistema de Google.
Los desarrolladores ya pueden acceder a una versión preliminar a través de la API de Gemini Live y Google AI Studio para crear aplicaciones basadas en traducción conversacional.
Además, clientes empresariales seleccionados tendrán acceso a Gemini 3.5 Live Translate dentro de Google Meet durante las próximas semanas, antes de una expansión más amplia.
Google también confirmó que la función llegará próximamente a la aplicación Google Translate para Android e iOS.
Traducción sin necesidad de auriculares
La compañía amplió además las opciones de uso para dispositivos móviles.
Hasta hace poco, las funciones avanzadas de traducción en vivo requerían auriculares compatibles o los Pixel Buds de Google. Con esta actualización, los usuarios podrán escuchar la traducción directamente desde el teléfono.
En dispositivos Android se incorpora un nuevo "modo escucha", que permite acercar el teléfono al oído como si se tratara de una llamada telefónica y recibir la traducción de forma inmediata.
Esta función podría resultar especialmente útil en viajes, reuniones, visitas guiadas o situaciones donde no se dispone de auriculares.
Menos ruido y mayor precisión
Gemini 3.5 Live Translate también incorpora mejoras en el procesamiento de audio.
El modelo puede filtrar automáticamente ruidos ambientales y mantener la calidad de la conversación incluso en entornos con mucho ruido de fondo, una limitación frecuente en sistemas anteriores de traducción automática.
Asimismo, el sistema gestiona de manera automática las conversaciones multilingües sin que los usuarios deban configurar manualmente los idiomas involucrados.
Seguridad y transparencia mediante SynthID
Como medida de seguridad, Google anunció que todas las voces generadas por Gemini 3.5 Live Translate incorporarán marcas de agua digitales mediante la tecnología SynthID.
Estas marcas quedan integradas en la forma de onda del audio generado por inteligencia artificial y permiten identificar que la voz fue creada por un sistema automatizado.
La empresa señala que actualmente no existe una forma pública de eliminar estas marcas, lo que busca aumentar la transparencia y reducir posibles usos fraudulentos de voces sintéticas.
La apuesta de Google por la traducción conversacional
La traducción automática es uno de los campos en los que Google trabaja desde hace más de una década, pero la llegada de modelos generativos como Gemini ha permitido acelerar notablemente la calidad y naturalidad de los resultados.
Con Gemini 3.5 Live Translate, la compañía busca convertir la traducción instantánea en una herramienta cotidiana para usuarios, empresas y desarrolladores, en un contexto donde la comunicación global y el uso de asistentes de inteligencia artificial continúan expandiéndose.
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]