Google a lansat Portraits, un experiment A.I. care permite utilizatorilor să interacționeze cu avatari ai experților reali, oferind sfaturi și coaching personalizat. Această funcție este alimentată de Gemini și se bazează pe conținutul creat de pesonalitatea interpretată de A.I. .
Primul expert prezentat este Kim Scott, autoarea cărții ,,Radical Candor”, cunoscută pentru sfaturile sale despre leadership și comunicare eficientă. Utilizatorii pot pune întrebări și vor primi răspunsuri bazate pe conținutul original al expertului, într-un format conversațional.
În prezent, Portraits este disponibil doar în Statele Unite, pentru utilizatori cu vârsta peste 18 ani, prin platforma Google Labs. Este încă în fază experimentală, iar Google nu a anunțat un calendar oficial pentru extinderea globală sau adăugarea altor experți.
Google a prezentat Gemini 2.5, o versiune avansată a modelului său A.I., care introduce noi capabilități de voce și text-to-speech (TTS). Aceste îmbunătățiri sunt concepute pentru a oferi interacțiuni vocale fluide, cu un ton natural, stil personalizabil și răspunsuri contextuale.
Modelul recunoaște emoțiile și tonalitatea vocii utilizatorului, adaptându-și răspunsurile în funcție de starea acestuia, permițând A.I.-ului să interpreteze și să producă vorbire cu intonare expresivă și răspunsuri rapide, eliminând întârzierile. Utilizatorii vor putea ajusta accentul, tonul și stilul vorbirii, inclusiv opțiuni precum șoapte sau intonare emoțională. De asemenea, A.I.-ul poate distinge între sunetele relevante și zgomotul de fundal, răspunzând doar când este necesar. Modelul suportă peste 24 de limbi, permițând combinarea mai multor limbi într-o singură conversație. Nu în ultimul rând, integrează informații în timp real din Google Search sau surse externe.
Google va pune la dispoziție două configurații: Gemini 2.5 Pro Preview, destinat producției audio de calitate superioară și Gemini 2.5 Flash Preview, optimizat pentru generarea rapidă de conținut audio.
Pentru a asigura transparență în utilizarea AI-ului vocal, toate materialele audio generate prin Gemini 2.5 includ SynthID, sistemul de watermarking digital de la Google care marchează clar conținutul produs de A.I. .
Funcționalitățile Gemini 2.5 au fost testate riguros, atât intern cât și extern cu echipe de „red teaming” (n.red. termen folosit în securitate cibernetică și testarea sistemelor prin simularea unor atacuri reale), pentru a preveni abuzurile și a detecta posibile vulnerabilități înainte de lansare publică.