Noua „Constituție” a AI-ului Claude are 57 de pagini și promite că nu va distruge umanitatea

Scris de | 22 ianuarie, 2026
Noua „Constituție” a AI-ului Claude are 57 de pagini și promite că nu va distruge umanitatea

Compania Anthropic face un pas decisiv spre transparență și responsabilitate în dezvoltarea AI-ului Claude. Dezvoltatorii au publicat recent un document de 57 de pagini, intitulat „Constituția lui Claude”. Acesta nu este un simplu manual tehnic, ci un text fundamental care servește drept autoritate finală asupra „caracterului etic” și „identității de bază” a modelului AI.

Spre deosebire de seturile anterioare de reguli, lansate în mai 2023, care funcționau mai degrabă ca niște ghiduri simple de comportament, noua constituție are un scop dublu. Pe de-o parte specifica ce trebuie să facă modelul, și pe de alta, va încerca să îl ajute să înțeleagă de ce i se cere un anumit comportament.

Un document scris pentru AI, nu pentru oameni

Un aspect fascinant al acestei inițiative este publicul țintă al textului. Anthropic subliniază că documentul este redactat având ca destinatar principal chiar modelul Claude, nu cititorii umani externi. Limbajul folosit include concepte abstracte și profund umane, precum „virtute”, „înțelepciune” și „valori”, termeni pe care inginerii încearcă să îi facă inteligibili pentru algoritm. Această abordare vizează crearea unei entități autonome capabile să navigheze prin situații cu miză mare și să gestioneze conflicte valorice fără a necesita intervenție constantă.

„Constituția” definește intențiile clare ale companiei: Claude trebuie să fie util, onest și, poate cel mai important, inofensiv. Textul instruiește explicit modelul să evite acțiunile care ar putea duce la distrugerea umanității, punând un accent major pe siguranță existențială.

Transparență și limitele antrenamentului

Rolul acestui document este critic. El influențează direct antrenamentul și comportamentul final al chatbot-ului, servind ca reper pentru toate celelalte instrucțiuni. Totuși, oficialii Anthropic admit cu onestitate că antrenarea modelelor de limbaj rămâne o sarcină extrem de dificilă.

Ei recunosc că, în practică, comportamentul lui Claude ar putea să nu reflecte întotdeauna idealurile înalte descrise în constituție. Cu toate acestea, compania consideră că publicarea intențiilor și a viziunii lor este un act necesar de transparență. Prin intermediul actualizărilor constante, Anthropic promite să fie deschisă cu privire la momentele în care realitatea comportamentului AI se abate de la teoria constituțională.

Etichete: , , , ,

Sursa: via TheVerge