OpenAI a actualizat Operator, agentul său autonom de navigare web și control al cursorului, făcând astfel abonamentul premium mai atractiv. Ca și Google Ultra, OpenAI oferă un abonament premium foarte scump, care a ajuns acum la 200 de dolari pe lună. Acesta permite și accesul la agentul Operator.
Actualizare pentru Operator
De-acum înainte, agentul autonom Operator, care utiliza modelul anterior de limbaj multimodal mare GPT-4o, va trece la modelul de raționament o3, mai nou și mai puternic.
Operator este un model din categoria CUA (Computer-User Agent). El dispune de un browser și poate naviga și face diverse lucruri online în locul unui utilizator uman. Actualizarea este disponibilă ca „research preview” pentru abonații plătitori ai planului Pro de la OpenAI, cu o taxă lunară de 200 USD. Cu alte cuvinte, OpenAI spune că aceasta nu este varianta finală și că este posibil să întâmpine probleme sau să nu poată face tot ce promite.
Recent, rivalul Google a anunțat propriul pachet de abonament de top pentru inteligență artificială, Ultra/ Acesta are un preț de aproape 250 USD pe lună pentru a accesa cele mai recente modele Gemini multimodal, generare de imagini Imagen și generare de videoclipuri Veo, dar și agentul web Project Mariner. Prin comparație, planul Pro de la OpenAI pare acum ceva mai accesibil.
Operator a fost conceput să vizualizeze pagini web în mod autonom pentru a finaliza sarcini pe internet. Poate face rezervări, liste de cumpărături, poate comandarea bilete la evenimente. Această capacitate îi permite să finalizeze sarcinile utilizatorului direct printr-o interfață de browser. Din motive de siguranță, confidențialitate și securitate, Operator nu a folosit niciun browser web existent pe PC-ul sau Mac-ul utilizatorului. În schimb, rulează într-un browser virtual găzduit în cloud, accesibil prin intermediul unui site dedicat. Combină capacitățile de viziune, raționament și interacțiune bazate pe modelul o3, marcând o nouă direcție pentru OpenAI în domeniul agenților AI.
Cu această actualizare, OpenAI își propune să îmbunătățească performanța în mai multe dimensiuni cheie. Noul Operator bazat pe o3 demonstrează o persistență și o precizie îmbunătățite în timpul interacțiunilor browserului.
În termeni practici, aceasta înseamnă că este mai probabil să finalizeze sarcinile utilizatorului cu succes și cu o nevoie mai mică de corecții sau repetiții. Mai mult, utilizatorii se pot aștepta la răspunsuri mai clare, mai structurate și mai cuprinzătoare.
În evaluările comparative, noul model prezintă un avantaj distinct în ceea ce privește preferințele față de predecesorul său. Studiile privind preferințele umane arată că utilizatorii preferă modelul o3 pentru stilul, complexitatea și claritatea sa. De asemenea, are performanțe excelente în ceea ce privește respectarea instrucțiunilor și eficiența, deși rezultatele privind corectitudinea factuală sunt mai echilibrate între versiuni.
Într-un exemplu care a implicat o cerere de rezervare la restaurant, noul model a oferit o listă mai clară și mai detaliată a rezervărilor disponibile, inclusiv locații, evaluări Michelin și notițe despre locuri, prezentate într-un tabel bine formatat. Versiunea anterioară, deși funcțională, oferea mai puține informații într-un mod mai puțin organizat, conform unei imagini incluse în noile note de lansare o3 Operator:
Modelul o3 moștenește, de asemenea, măsurile de siguranță introduse în versiunile anterioare, cu ajustări suplimentare. OpenAI a integrat o instruire îmbunătățită împotriva executării de sarcini cu potențial de risc, a vulnerabilităților și a greșelilor care implică intenția utilizatorului. Evaluările arată că modelul confirmă acum 94% din acțiunile sensibile înainte de a le executa, cu o confirmare de 100% în tranzacțiile financiare. Operatorul o3 menține o limită precaută în anumite interacțiuni web cu risc ridicat, cum ar fi e-mailul sau platformele financiare, unde poate necesita supravegherea utilizatorului prin intermediul Modului Vizionare sau poate refuza în mod explicit să continue.