OpenAI ar fi transcris 1 milion de ore de videoclipuri de pe YouTube pentru a antrena GPT-4

Scris de | 10 aprilie, 2024
OpenAI ar fi transcris 1 milion de ore de videoclipuri de pe YouTube pentru a antrena GPT-4

OpenAI ar fi folosit videoclipuri de pe YouTube pentru a antrena GPT-4, conform unei informații dezvăluite de New York Times în ultimul weekend. În total, peste un milion de ore de clipuri ar fi fost folosite pentru această sarcină, iar informația apare la doar câteva zile după ce CEO-ul YouTube, Neal Mohan, a spus că transcrierea clipurilor pe YouTube pentru antrenamentul unui AI ar fi o „încălcare flagrantă” a politicilor sale, într-un interviu acordat celor de la Bloomberg.

„Când un creator de conținut își aduce munca pe platforma noastră, au anumite așteptări. Una dintre acestea este ca termenii de utilizare a serviciului nostru să fie respectați. Acesta nu permite lucruri precum transcrierea unui videoclip sau descărcarea unor anumite părți din el” a declarat Mohan pentru Bloomberg în respectivul interviu.

Conform NY Times, membri ai echipei celor de la OpenAI, inclusiv președintele Greg Brockman, au ajutat personal la colectarea clipurilor de YouTube, conform surselor ziarului. Articolul detaliază cum OpenAI și multe alte companii de tech se confruntă cu dificultăți în colectarea unor date suficiente pentru a antrena modelele lor AI. OpenAI ar fi folosit Whisper, un software de transcriere AI, pentru a colecta mai multe date cu care să antreneze GPT-4, ultima versiune a lui ChatGPT.

Dezvăluirea celor de la New York Times ar putea să creeze divergențe foarte mari între OpenAI și Google. Google nu va fi cu siguranță foarte fericită cu faptul că OpenAI îi folosește conținutul pentru a îmbunătăți ChatGPT, însă până acum nu am văzut o poziție oficială a gigantului în acest sens. CTO-ul OpenAI, Mira Murati, a declarat că nu este sigură dacă au fost folosite videoclipuri de pe YouTube în antrenarea lui Sora, AI-ul care ar trebui să creeze videoclipuri doar din texte. Notabil este și faptul că New York Times se află într-un proces cu cei de la OpenAI, iar OpenAI și Meta sunt date în judecată de mai mulți autori și publicații care acuză giganții tech că ar fi antrenat modelele lor AI cu ajutorul unui conținut pentru care nu aveau drepturi.

Etichete: , , , , ,

Sursa: OpenAI Reportedly Transcribed 1 Million Hours of YouTube Videos to Train GPT-4