Google lansează Gemini 3.5 Live Translate pentru traducere vocală aproape în timp real

Scris de | 10 iunie, 2026
Google lansează Gemini 3.5 Live Translate pentru traducere vocală aproape în timp real

Deși abia a ținut recent o conferință I/O, Google continuă lansările surpriză legate de noul model AI Gemini 3.5 cu Live Translate. Acesta este cel mai nou model audio al companiei pentru traducere vocală „speech-to-speech”. Noutatea este că sistemul poate traduce aproape în timp real în peste 70 de limbi, fără să aștepte neapărat ca vorbitorul să termine fraza.

Gemini 3.5 Live Translate schimbă traducerile vocale

Gemini 3.5 Live Translate detectează automat limba vorbită și generează traduceri audio care păstrează intonația, ritmul și tonalitatea vocii. Google spune că modelul rămâne la doar câteva secunde în urma vorbitorului, încercând să echilibreze viteza cu nevoia de context pentru o traducere mai corectă.

Diferența față de sistemele clasice este că Gemini 3.5 Live Translate nu funcționează strict pe modelul „vorbește, așteaptă, primește traducerea”. Modelul procesează discursul pe măsură ce acesta este transmis, ceea ce reduce pauzele artificiale și face conversațiile mai apropiate de un dialog natural. Asta înseamnă traduceri vocale mai fluide în conversații, apeluri, întâlniri, lecții sau transmisiuni. Dezvoltatorii au astfel acces la un model care poate fi integrat în aplicații cu traducere simultană, inclusiv în medii zgomotoase sau imprevizibile.

Unde este disponibil noul model Google

Google începe lansarea Gemini 3.5 Live Translate pe mai multe direcții. Dezvoltatorii îl primesc în public preview prin Gemini Live API și Google AI Studio, în timp ce companiile îl vor putea testa în Google Meet printr-un private preview disponibil luna aceasta. Pentru utilizatorii obișnuiți, modelul ajunge în aplicația Google Translate pe Android și iOS. În aplicație, funcția Live translate poate fi folosită cu o pereche de căști conectate, astfel încât traducerea să redea mai bine tonul vorbitorului în peste 70 de limbi.

Pe Android, Google introduce și un nou „listening mode”, care permite ascultarea traducerii direct prin difuzoarele telefonului. Practic, utilizatorul ține telefonul la ureche ca într-un apel normal, iar traducerea audio este redată mai discret, fără a fi auzită de cei din jur.

Google Meet primește suport extins pentru traducere vocală

În Google Meet, speech translation va trece la Gemini 3.5 Live Translate și va crește de la cinci limbi la peste 70. Mai important, Google spune că întâlnirile vor putea acoperi peste 2.000 de combinații lingvistice, nu doar traduceri către și din engleză. Actualizarea pentru Google Meet va fi disponibilă mai întâi pentru anumiți clienți business Google Workspace, prin private preview. Un rollout mai larg este planificat pentru finalul acestui an.

Google menționează și o componentă de siguranță: toate materialele audio generate de modelele sale sunt marcate cu SynthID. Acest watermark este imperceptibil pentru utilizator, dar este integrat în ieșirea audio pentru ca materialul generat de AI să poată fi detectat ulterior. Funcția are rolul de a limita riscurile legate de dezinformare, mai ales într-un context în care traducerea vocală generată automat poate suna din ce în ce mai natural.

Etichete: , , , ,

Sursa: Google