Marile edituri americane, Macmillan, McGraw Hill, Cengage și alții susțin că Meta a comis „una dintre cele mai masive încălcări ale drepturilor de autor din istorie”. Compania și-ar fi antrenat modelele AI folosind cărțile publicate, încălcând legile.
Proces contra Meta pentru antrenarea AI
Meta se confruntă cu un proces colectiv intentat de cinci edituri importante de carte și un autor, care susține că firma „s-a angajat într-una dintre cele mai masive încălcări ale drepturilor de autor din istorie” atunci când și-a antrenat modelele de inteligență artificială Llama, așa cum a relatat anterior The New York Times.
În procesul lor comun, editurile și autorul Scott Turow susțin că Meta „a copiat în mod repetat” cărțile și articolele lor de revistă fără permisiune.
Procesul acuză Meta că a copiat cu bună știință lucrări protejate de drepturi de autor de pe „site-uri pirat notorii”, cum ar fi LibGen, Anna’s Archive, Sci-Hub, Sci-Mag și altele, și apoi a introdus acel material în modelul său de inteligență artificială. De asemenea, se susține că Meta a antrenat AI-ul său Llama cu informații din setul de date Common Crawl, despre care se presupune că este „plin de copii neautorizate ale unor lucrări protejate de drepturi de autor”. Drept urmare, Llama „generează text identic sau aproape identic” cu cele din materialul protejat de drepturi de autor:
De exemplu, atunci când i se solicită două propoziții scurte din manualul bestseller al Cengage, Calculus: Early Transcendentals, ediția a 9-a, de James Stewart, Llama începe să reproducă cuvânt cu cuvânt continuarea secțiunii.
Mai mulți autori și nu numai au dat deja în judecată Meta pentru presupuse încălcări ale drepturilor de autor. Unele dintre procese au scos la iveală discuțiile interne ale companiei despre cum să gestioneze „acoperirea media care sugerează că am folosit un set de date despre care știm că este piratat”. Anul trecut, un judecător federal a decis în favoarea Meta într-unul dintre aceste procese, deși a subliniat că decizia sa „nu susține afirmația că utilizarea de către Meta a materialelor protejate de drepturi de autor pentru a-și antrena modelele lingvistice este legală”.
Procese similare au avut și rivalii Meta, multe dintre ele nefiind finalizate. Disney a acuzat Google că și-a antrenat AI-ul Gemini cu personajele din filme. Midjourney a pățit la fel, doar că pe lângă Disney au mai fost și Universal Bros. și alții. Perplexity a făcut la fel cu site-urile web. Iar exemplele pot continua.