Anthropic lansează Opus 4.8, ultima etapă înainte de Mythos

Scris de | 29 mai, 2026
Anthropic lansează Opus 4.8, ultima etapă înainte de Mythos

Anthropic a lansat oficial Claude Opus 4.8, un pas înainte către viitorul super-AI botezat Mythos. Noul model se concentrează pe îmbunătățirea sincerității inteligenței artificiale prin învățarea modelului să recunoască momentele în care îi lipsesc informațiile.

Cum este Claude Opus 4.8

Opus 4.8, cel mai recent model Claude, a fost proiectat din start să fie mai sincer cu utilizatorul și să spună clar ceea ce nu știe sau dacă are un nivel scăzut de încredere în ceea ce spune.

Lansat joi, Claude Opus 4.8 nu este încă Claude Mythos, viitorul super-AI promis de Anthropic. Este însă o evoluție clară față de Opus 4.7, promite compania.

Opus 4.8 este puntea către Mythos. Se află pe scara internă a Anthropic, între Opus 4.7 și versiunea mai capabilă Claude Mythos Preview, care este în prezent restricționată la un număr mic de organizații din cadrul Proiectului Glasswing pentru activități de securitate cibernetică.

Anthropic a anunțat că lucrează la lansarea modelelor din clasa Mythos pentru toți clienții în următoarele săptămâni. Mythos este un LLM cu capacități avansate de securitate cibernetică. Ca parte a Proiectului Glasswing, firme importante de tehnologie precum Amazon, Microsoft și Apple au permisiunea actuală de a utiliza Mythos în scopuri de securitate cibernetică. Dar încă nu există o dată de lansare clară pentru Claude Mythos.

Sosit la aproximativ șase săptămâni după Claude Opus 4.7, Opus 4.8 preia rolul de cel mai puternic model al Anthropic disponibil în general și, în mare parte, marchează o îmbunătățire față de predecesorul său.

Opus 4.8 este în fruntea unei categorii cheie: onestitatea, modelul obținând scoruri „aproape perfecte” atunci când vine vorba de admiterea că nu știe răspunsul la o întrebare de codare. Nici măcar extrem de puternicul Mythos Preview nu a putut depăși Opus 4.8 în acest test de onestitate, ocupând locul al doilea, în timp ce Opus 4.7 a terminat pe un distant loc patru.

Anthropic a vorbit, de asemenea, despre „indicii îngrijorătoare legate de conștientizarea evaluării”. Opus 4.8 a dat semne că știa că este testat. Specialiștii au remarcat în același timp o „tendință a modelului de a raționa despre modul în care vor fi notate rezultatele sale”. Aceste preocupări nu sunt specifice doar Opus 4.8 – cele mai recente modele „de frontieră” par adesea să știe când sunt testate și stimulate.

Etichete: , , , , ,

Sursa: PCWorld