Come funziona la traduzione vocale in tempo reale di Google Meet e quando arriva in Italia

Un mese dopo l’annuncio sul palco del Google I/O, con una rapidità di distribuzione non comune neanche fra i colossi del tech, la funzione di traduzione vocale in tempo reale di Google Meet sbarca ufficialmente in Italia. Basata sui modelli audio di Google DeepMind, la novità “doppia” le voci con latenza minima, conservando timbro ed emozione originale, ed è già attiva nelle combinazioni inglese-italiano e viceversa. Al momento riservata agli abbonati Google AI Pro (un mese gratis e poi 21,99 euro al mese) e AI Ultra (249,99 dollari al mese, per ora solo negli Stati Uniti) arriverà a breve anche per i clienti Workspace business, con il rilascio di altre lingue nelle prossime settimane. La strategia di rilascio a scaglioni e per diverse tipologie di utenza servirà a raccogliere feedback prima del rilascio a tutta la base consumer di Meet.
Da I/O 2025 al rollout italianoDurante la conferenza Google I/O di metà maggio – a proposito: qui trovate tutte le novità annunciate - l’azienda aveva mostrato una demo live di Meet in cui le voci venivano tradotte istantaneamente da inglese a spagnolo, senza perdere intonazione né ritmo. Il 12 giugno al Google Cloud Summit di Milano la stessa tecnologia è stata resa disponibile anche per gli utenti italiani, aprendo la fase di distribuzione graduale per gli utenti nel nostro paese. O meglio, per chiunque voglia adoperare la traduzione italiano-inglese e viceversa su Meet, ovunque nel mondo.
Come funziona il “doppiaggio live”La traduzione non si limita a trascrivere e sottotitolare: il modello audio neurale di riferimento (battezzato AudioLM) riconosce la voce, genera la traduzione e la rigenera in tempo reale con lo stesso timbro, intonazione, inflessione e sfumature di chi parla. Ed è obiettivamente questo il passaggio più impressionante. Il risultato è un effetto “voice-over” naturale, con un leggero sottofondo dell’originale per non perdere il contatto umano. Latenza e qualità sono comparabili a una normale pausa di conversazione.
È possibile tradurre in entrambe le direzioni tra inglese e italiano; restano operative anche le combinazioni inglese-spagnolo viste all’opera nella demo dell’evento californiano. Google ha confermato che tedesco e portoghese saranno le prossime ad aggiungersi entro l’estate.
Dove si trova il pulsante (e perché non lo vedi ancora)In riunione compare un badge “Traduzione vocale” accanto agli strumenti. Basta scegliere Lingua che parli e Lingua che preferisci ascoltare; se l’altra parte imposta una lingua diversa, la traduzione parte in automatico. Chi usa la funzione per la prima volta deve dare consenso esplicito alla traduzione della propria voce. Google assicura che l’elaborazione vocale avviene nel rispetto delle regole Regolamento generale europeo per la protezione dei dati personali e delle prescrizioni del Digital Markets Act (uno dei due regolamenti che, insieme al Digital Services Act, sovrintende l’ecosistema dei servizi digitali nell’Ue), con controlli granulari sugli opt-in e crittografia end-to-end. In effetti, anche rispetto a proposte simili introdotti da altri colossi, da Microsoft ad Apple, il rilascio in Italia è stato citato come esempio di conformità alle norme con un roll-out in tempi rapidi rispetto al mercato statunitense. Nonostante le lamentele sull’iper-regolamentazione confidate anche a Italian Tech dal Ceo di Google Sundar Pichai proprio durante l’I/O di maggio.
La roadmap prevede l’integrazione di Gemini Live (l’assistente conversazionale multimodale annunciato sempre a I/O) per tradurre anche riferimenti visivi condivisi nel corso della videochiamata. L’obiettivo è arrivare a decine di lingue entro il 2026.
repubblica