Traduire une conversation à voix haute, en direct, dans plus de 70 langues, sans perdre le ton ni le rythme de la personne qui parle. Google a présenté Gemini 3.5 Live Translate, un nouveau modèle audio qui vise la traduction en temps réel.

Une traduction qui suit le fil de la parole
Le modèle promet une faible latence sur plus de 70 langues. Autrement dit, le délai entre ce que dit l’interlocuteur et la traduction restituée tend à disparaître, ce qui rend une vraie conversation possible plutôt qu’un échange haché de phrases attendues.
Gemini 3.5 Live Translate détecte aussi automatiquement les entrées multilingues au sein d’une même session. Si deux personnes basculent d’une langue à l’autre en pleine discussion, le système suit sans qu’on ait à régler quoi que ce soit. Cette détection automatique évite le réglage manuel qui cassait l’usage des traducteurs vocaux jusqu’ici.
Préserver la voix, pas seulement les mots
Le point que Google met en avant dépasse la simple traduction. Le modèle traite l’audio de façon native et préserve la hauteur et le rythme de la voix d’origine. La traduction ne sonne donc pas comme une voix de synthèse plate. Elle garde une partie de l’intonation et du débit de la personne, ce qui change l’expérience d’écoute.
S’ajoute un filtrage du bruit conçu pour les environnements sonores difficiles. Concrètement, le système est pensé pour fonctionner dans un café bondé ou une rue passante, pas seulement dans un studio silencieux. C’est souvent là que les traducteurs vocaux échouaient.
Une brique pour les assistants temps réel
Le modèle est accessible via l’API Gemini Live et dans Google AI Studio. Ce choix vise les développeurs. En ouvrant la traduction temps réel comme une brique logicielle, Google pousse son intégration dans des applications tierces : visioconférence, support client, accessibilité, assistants vocaux.
La concurrence sur l’audio s’intensifie. ElevenLabs vient de signer avec le Royaume-Uni pour rendre ses services publics accessibles dans toutes les langues, et OpenAI pousse aussi ses modèles vocaux. Avec Live Translate, Google place la traduction en direct au cœur de sa pile audio. La barrière de la langue devient un problème logiciel, traité en temps réel.