OpenAI poate să îți „cloneze” vocea în doar 15 secunde

Scris de | 1 aprilie, 2024
OpenAI poate să îți „cloneze” vocea în doar 15 secunde

OpenAI este compania care conduce „revoluția” AI, cu produse de succes precum Dall-E și ChatGPT, însă noile sale demonstrații tehnologice sunt însă cele care au potențialul de a schimba complet felul în care ne conținutul online, și nu numai, ar putea fi realizat. După AI-ul Sora, care poate genera clipuri video realiste și complexe folosind doar câteva cuvinte, OpenAI a anunțat o îmbunătățire majoră pentru AI-ul său care generează voci umane, Voice Engine. Se pare că o înregistrare de 15 secunde este de ajuns acum pentru ca AI-ul să poată „copia” oricare voce umană.

Noul Voice Engine de la OpenAI va fi foarte performant și foarte ieftin

Noul Voice Engine folosește baza API-ului său din 2022, care putea genera voci umane pe baza unor înregistrări mai lungi, tehnologie folosită și pentru a-i da voce lui ChatGPT în varianta de mobil. Noul model AI este însă extrem de ușor de „antrenat”, putând funcționa cu înregistrări scurte, care sunt de ajuns pentru a realiza o „clonă” realistă, cu tot cu intonație naturală.

OpenAI consideră că această tehnologie ar putea ajuta persoanele care și-au pierdut vocea să poată comunica într-o manieră mai naturală, prin antrenarea AI-ului pe înregistrări mai vechi ale lor și folosirea text-to-speech pentru a putea „vorbi” din nou. De asemenea, AI-ul poate folosi vocea pentru a traduce în alte limbi. Astfel, poți livra un material în mai multe limbi, cu vocea unei singure persoane, chiar dacă înregistrarea originală a fost realizată doar într-una.

Desigur, OpenAI spune că înțelege riscurile noului Voice Engine, așa că nu lansează această tehnologie către public, cel puțin nu acum. Având în vedere că este și un an electoral în SUA, compania încearcă să evite controversele și se consultă cu persoane implicate în guvern, media, entertainment, educație și alte domenii. De exemplu, Voce Engine va putea detecta anumite voci „celebre” și va bloca generarea de conținut folosind astfel de mostre. Totodată, sistemul va fi monitorizat constant pentru a evita generarea de conținut nepermis.

OpenAI are câteva demonstrații impresionante pe site-ul său, însă nu spune când va lansa această tehnologie către public. Anumite informații scăpate pe internet anterior despre această tehnologie sugera un preț de 15 dolari pentru un milion de caractere pentru generarea de voci, adică echivalentul unui roman. O versiune „HD” a Voice Engine, probabil la calitate mai înaltă, ar putea costa dublu, adică 30 de dolari.

Etichete: , , ,

Sursa: OpenAI