Lovitură importantă pentru Google și OpenAI: Reddit nu mai permite minarea datelor sale pentru antrenarea inteligenței artificiale. Cel puțin nu pe gratis

Scris de | 10 mai, 2024
Lovitură importantă pentru Google și OpenAI: Reddit nu mai permite minarea datelor sale pentru antrenarea inteligenței artificiale. Cel puțin nu pe gratis

Datele disponibile public pe internet sunt sursa principală pentru companiile AI în ceea ce privește antrenarea LLM-urilor și chatboților precum ChatGPT și Google Gemini. Odată ce întrebi ceva un chatbot AI, răspunsurile sunt formate pe baza datelor deja disponibile pe internet. La fel cum e și pentru utilizatorii obișnuiți, aceste date sunt accesibile și companiilor AI. Cu toate acestea, se pare că acest lucru nu mai e valabil pentru Reddit, iar platforma interzice companiilor AI să mai extragă datele sale gratuit.

Mişcarea recentă vine după ce Reddit a anunţat anul trecut că va licenţia datele sale către companiile AI. În februarie, Google a fost primul gigant din tehnologie care a semnat un acord de licențiere a datelor cu Reddit, plătind companiei de social media aproximativ 60 de milioane de dolari pe an.

Reddit a anunțat noua „Politică de Conținut Public” joi, ca un ghid pentru modul în care platforma partajează datele utilizatorilor săi cu alte companii. Reddit a lansat, de asemenea, un subreddit dedicat cercetătorilor care lucrează cu datele sale.

203 millioane de dolari obținuți până acum din licențierea datelor

Cea mai mare parte a veniturilor Reddit provine din vânzarea de publicitate și din utilizarea API-ului de către dezvoltatori. În timp ce Reddit este acum o companie listată pe bursă, are nevoie de mai multe surse de venit pentru a atrage investitori. Deoarece platforma servește ca centru de agregare a datelor, poate obține bani vânzând aceste date clienților, în special companiilor din spatele chatboților AI precum Google și OpenAI. Raportul din momentul IPO-ului Reddit a indicat că platforma a obținut 203 milioane de dolari din licențierea datelor sale până acum, iar acest număr, cel mai probabil, va crește.

Este important de menționat și că noua politică a Reddit privind folosirea datelor vizează în principal companiile care le folosesc în scopuri comerciale, cum ar fi antrenarea chatboților AI și a LLM-urilor. Cu toate acestea, platforma s-a angajat să mențină un spațiu destinat cercetătorilorși entităților non-comerciale. Datele Reddit vor fi încă disponibile gratuit pentru acești utilizatori, iar compania chiar a pornit un subreddit dedicat, r/RedditForResearchers, pentru a satisface nevoile lor.

Noua politică de date a Reddit nu este doar despre restricționarea accesului la datele sale. Este, de asemenea, despre protejarea intimității utilizatorilor. Platforma subliniază că utilizatorii au dreptul să opteze pentru a nu partaja datele lor cu companiile AI.

Mai mult, utilizatorii Reddit au primit interzis pentru utilizarea conținutului la spam, hărțuire, sau pentru desfășurarea de activități cum ar fi „verificări de background, recunoaștere facială, supraveghere guvernamentală sau pentru a ajuta forțele de ordine să facă oricare dintre vreuna dintre cele de mai sus”. Această politică este menită să asigure că datele utilizatorilor sunt gestionate responsabil și cu respect față de preocupările acestora privind intimitatea.

Asus ROG Zephyrus g16 - 2024

Etichete: , , , ,

Sursa: Reddit's new policy bans companies from mining its valuable user data