Anthropic a lansat Claude Fable 5, primul AI care aduce inteligența Mythos către utilizatorii obișnuiți. Este mai bine cotat decât primul preview de Mythos văzut acum două luni.
Ce aduce Claude Fable 5
Deși Claude Fable 5 va fi accesibil tuturor, Anthropic a subliniat faptul că întrebările privind securitatea cibernetică, biologie și chimie, precum și distilare vor fi redirecționate către versiunea anterioară Opus 4.8.
Anthropic a făcut prima dezvăluire a modelului său de inteligență artificială Claude Mythos, în aprilie. Compania a prezentat pașii pe care îi urmează pentru lansarea „în siguranță” a acestui produs. Evident, publicul specializat în inteligență artificială a așteptat cu nerăbdare să pună mâna pe capabilitățile sale pentru a le testa.
Acum, odată cu lansarea de astăzi a Claude Fable 5, Anthropic spune că are în sfârșit un model de această clasă care este „sigur pentru uz general”. Anthropic lansează, de asemenea, modelul Mythos 5, disponibil fără restricții, membrilor programului său Project Glasswing, pentru utilizare în contexte sensibile de securitate cibernetică și biologie.
Ca în cazul fiecărui model nou de ultimă generație de la Frontier Labs, Anthropic are o selecție de teste de performanță Fable 5 pe parcursul unei game de teste larg acceptate, care evidențiază nivelul său de performanță de ultimă generație, dar aceste cifre nu sunt la fel de interesante ca cazurile de utilizare specifice pe care compania le evidențiază pentru acest nivel de capacitate.
De exemplu, compania subliniază modul în care Stripe a reușit, se pare, să efectueze migrarea unei baze de cod Ruby de 50 de milioane de linii într-o singură zi, migrație care altfel ar fi necesitat două luni de efort în echipă dacă ar fi fost efectuată manual. Acest tip de comprimare a sarcinilor într-o lucrare de o asemenea amploare ilustrează modul în care Fable 5 și Mythos 5 „pot funcționa autonom mai mult timp decât orice modele Claude anterioare”, pe lângă nivelul lor general ridicat de capacitate.
Pentru sarcinile de vizualizare, Anthropic spune pur și simplu că Fable 5 este „noul model de ultimă generație”. Printre alte realizări, compania spune că a reușit să joace Pokemon FireRed în întregime folosind doar o interacțiune minimală, de nivel vizual. Modelele anterioare se pare că se chinuiau să finalizeze această sarcină chiar și cu posibilitatea de a solicita ajutor extern prin apelarea altor instrumente.
Profesorul de la Wharton School și bloggerul despre inteligență artificială, Ethan Mollick, are, de asemenea, exemple privind ceea ce poate face Fable. Printre alte sarcini, el descrie cum a dat companiei Fable un document de specificații de 19 pagini pentru dezvoltarea unui instrument de clasificare și analiză a răspunsurilor nestructurate la chestionare. El descrie cum modelul a funcționat timp de „nouă ore și jumătate” pentru a genera un instrument „extrem de sofisticat” de care „cercetătorii au avut nevoie de ani de zile, dar de care nu a fost niciodată profitabil să fie creat”.
Pentru a împiedica accesul actorilor rău intenționați la capabilitățile de nivel Mythos, Anthropic spune că va redirecționa interogările pe anumite subiecte, și anume „securitate cibernetică, biologie și chimie sau distilare”, către Claude Opus 4.8 de ultimă generație. Compania spune că utilizatorii vor fi informați de fiecare dată când are loc această redirecționare.
