Open AI anunță ChatGPT-4o. AI-ul poate să vorbească natural, să „vadă” și chiar să „cânte”

Scris de | 14 mai, 2024
Open AI anunță ChatGPT-4o. AI-ul poate să vorbească natural, să „vadă” și chiar să „cânte”

Cu o zi înainte de Google I/O, OpenAI a ținut o prezentare numită Spring Update, care a adus anunțul unui nou model de LLM (Large Language Model): GPT-4o. Acesta este un model AI multimodal, iar litera „o” este prescurtarea de la „omni”, ceea ce înseamnă că ChatGPT-4o poate recunoaște mai multe tipuri de interacțiuni: prin text, vorbire și prin fotografii sau clipuri video. Vestea bună este că GPT-4o nu va rămâne exclusiv pentru cei care plătesc pentru abonamentele de la OpenAI, ci va veni și pe versiunea gratuită.

ChatGPT-4o este mai rapid decât modelele anterioare și va fi disponibil și pentru utilizatorii gratuiți

OpenAI a descris GPT-4o drept un model cu un nivel de „inteligență” similar cu cel al modelului GPT-4 pe care îl oferă exclusiv pentru abonați și pentru funcțiile Copilot de la Microsoft. Acesta este și mai rapid decât modelul GPT-4 Turbo. Cel mai mare upgrade este însă faptul că GPT-4o poate „vorbi” într-un limbaj natural.

Dacă ați văzut filmul „Her” cu Joaquin Phoenix și Scarlett Johansson, este o experiență similară, în care utilizatorul poate vorbi natural cu AI-ul, iar vocea virtuală este realistă, folosind inflexiuni naturale în vorbire. De asemenea, chatbot-ul poate chiar fi întrerupt în timp ce vorbește și poate să se adapteze imediat la noile cerințe sau reacții.Față de alte modele AI din trecut, răspunsurile ChatGPT-4o sunt aproape instante, fără pauze de „gândire”.

Ba chiar poate să recunoască nuanțele din vocea utilizatorului, precum starea de spirit. Și ChatGPT-4o poate la rândul său să își schimbe vocea. Poate să vorbească pe mai multe tonuri emoționale, poate să cânte, sau poate să imite o voce „robotică”.

Capabilitățile de „vedere” vor aduce noi tipuri de interacțiuni cu tehnologia

Capabilitățile sale de „vedere” par însă să fie foarte importante pentru acest update. Folosind aplicația de mobil, poți folosi ChatGPT-4o pentru a descrie anumite elemente din mediul înconjurător în timp real, fără să te bazezi doar pe o fotografie sau înregistrare. Chatbot-ul poate chiar să observe anumite evenimente și să le descrie rapid. Exemple ar putea fi urmărirea unei competiții sportive, iar ChatGPT poate să descrie regulile jocului în timp real. Un alt caz de utilizare ar fi pentru rezolvarea problemelor de matematică, sau chiar de programare. Poți să îi „arăți” AI-ului o problemă de matematică sau o bucată de cod și acesta poate să îți explice dacă este ceva greșit sau cum să o rezolvi sau să o îmbunătățești.

Au fost multe demonstrații pentru ChatGPT-4o publicate pe canalul de YouTube OpenAI, iar inclusiv pe scenă au prezentat inclusiv posibilitatea de a folosi aplicația ChatGPT drept un translator universal. Chatbot-ul include 50 de limbi deja.

Toate aceste funcții vin însă și pe desktop, prin intermediul unei aplicații native pentru macOS. O aplicație de Windows va fi disponibilă spre finalul anului. Pe desktop, ChatGPT-4o poate să citească ceea ce ai în clipboard. Astfel, dacă vrei să analizeze o bucată de cod, o poți copia și poți pune întrebări pe baza acestuia. De asemenea, poți permite chatbot-ului să îți vadă întregul ecran.

Utilizatorii „free” primesc multe noutăți odată cu ChatGPT-4o

ChatGPT-4o începe să fie deja disponibil în varianta gratuită a ChatGPT de pe site-ul oficial OpenAI și în aplicația de mobil în viitorul imediat. Cei care plătesc pentru abonamentele premium primesc o limită de mesaje de cinci ori mai mare. Se pare că odată ce „creditele” pentru utilizarea ChatGPT-4o se termină, chatbot-ul revine la modelul ChatGPT-3.5, deci nu vei putea să îl folosești nelimitat, cel puțin momentan.

Versiunea cu voce va fi disponibilă mai întâi pentru cei care plătesc abonamente în versiune alpha, începând de luna viitoare. Odată cu ChatGPT-4o vine și o nouă interfață pentru versiunea web. O altă noutate pentru utilizatorii „free” este însă accesul la „magazinul” GPT Store, unde poți găsi mai mulți chatbots specializați, creați de diverși dezvoltatori independenți, pe baza ChatGPT. O altă funcție care vine pe versiunea gratuită pentru prima dată este cea de a păstra în memorie anumite informații despre tine, ceva ce era disponibil doar pentru utilizatorii de abonamente premium.

Asus ROG Zephyrus g16 - 2024

Etichete: , , ,

Sursa: OpenAI