Cercetătorii Google demonstrează VLOGGER, AI-ul care poate anima oricare portret

Scris de | 19 martie, 2024
Cercetătorii Google demonstrează VLOGGER, AI-ul care poate anima oricare portret

Compania Alphabet, umbrela sub care stau Google, YouTube și multe alte divizii mai mult sau mai puțin independente, este atât de mare încât rareori știe stânga ce face dreapta. Alphabet are atât de multe ramuri de cercetare, în special în domeniul AI, încât nu este clar dacă există sau nu o viziune unitară la nivel de companie. De exemplu, YouTube introduce reguli noi care să marcheze conținutul creat cu AI, în speranța că utilizatorii vor fi mai greu de „păcălit” de creații sintetice, în timp ce alți cercetători Google anunță VLOGGER, o tehnologie AI care poate realiza animații realiste cu persoane reale pe baza unei singure fotografii.

Jumătate dintre cercetătorii din spatele VLOGGER sunt români

VLOGGER este un algoritm AI care poate anima o fotografie realist, atât pentru mișcările capului și mimicii feței, cât și a altor părți ale corpului, inclusiv mâinile. Atât timp cât există o referință foto cu persoana respectivă și un clip audio, VLOGGER poate anima imaginea cu un realism convingător. Desigur, clipurile din prezent demonstrate de cercetătorii Google nu sunt perfecte și pot fi observate anumite inconsistențe evidente, caracteristice creațiilor cu AI, dar acestea pot fi îmbunătățite în timp.

„În contrast cu munca anterioară, metoda noastră nu necesită antrenament pentru fiecare persoană, nu se bazează pe detectarea și decuparea feței, generează imaginea completă (nu doar fața sau buzele), și ia în considerare un spectru larg de scenarii (de exemplu, torso vizibil sau identități subiect diversificate) care sunt critice pentru a sintetiza corect ființe umane care comunică,” au scris autorii.

via GIPHY

Felul în care VLOGGER funcționează a fost explicat în lucrarea de cercetare publicată și semnată de șase cercetători Google, dintre care trei sunt români: Enric Corona, Andrei Zanfir, Eduard Gabriel Bazavan, Nikos Kolotouros, Thiemo Alldieck și Cristian Sminchisescu. La baza acestui algoritm stă MENTOR, un set de date care include 800.000 de „identități” de diverse etnii, vârste, poziții, haine și medii înconjurătoare, cu 2.200 de ore de clipuri video, folosit pentru antrenamentul AI-ului. Această cantitate de date este mai mare decât cea folosită pentru oricare alt tip de algoritm AI de acest gen de până acum.

Asus ROG Zephyrus g16 - 2024

Sursa: VentureBeat