Google a lansat funcția Deep Think pentru modelul Gemini 2.5 Pro și o optimizare pentru 2.5 Flash în cadrul prezentării de la evenimentul anual Google I/O 2025. De asemenea, au fost anunțate mai multe îmbunătățiri pentru inteligența artificială.
Cum funcționează Deep Think
Google a început să testeze un model de raționament numit Deep Think pentru Gemini 2.5 Pro, conform anunțului oficial făcut la conferința sa pentru dezvoltatori Google I/O. Potrivit CEO-ului DeepMind, Demis Hassabis, Deep Think al Gemini folosește „cele mai recente cercetări de ultimă generație” care oferă modelului capacitatea de a lua în considerare mai multe ipoteze înainte de a răspunde la interogări.
Google spune că a obținut un „scor impresionant” atunci când a fost evaluat folosind întrebări de la competiția Olimpiadei de Matematică din Statele Unite ale Americii din 2025. Cu toate acestea, Google dorește să își acorde mai mult timp pentru a efectua evaluări de siguranță și pentru a obține informații suplimentare de la experți în siguranță înainte de a-l lansa pe scară largă. De aceea, pune Deep Think inițial la dispoziția testerilor de încredere prin intermediul API-ului Gemini, pentru a primi mai întâi feedback-ul acestora.

Compania a prezentat, de asemenea, un model Gemini 2.5 Flash îmbunătățit, optimizat pentru viteză și eficiență. Acum este mai eficient decât înainte, folosește mai puține token-uri și a obținut scoruri mai mari în testele de raționament, multimodalitate, cod și context extins. Va fi disponibil în general la începutul lunii iunie. Deocamdată, versiunea îmbunătățită Gemini 2.5 Flash este disponibilă ca previzualizare prin Google AI Studio pentru dezvoltatori, prin Vertex AI pentru clienții enterprise și prin aplicația Gemini pentru alți utilizatori.
Deși majoritatea câștigurilor de eficiență abordate în prezentarea I/O s-au concentrat pe 2.5 Flash, Google a anunțat că aduce conceptul 2.5 Flash de „Thinking Budgets” la modelul său mai avansat 2.5 Pro. Această funcție vă va permite să echilibrați token-urile cheltuite în funcție de acuratețe și viteza de ieșire.
Compania va lansa noile tehnologii pe scară mai largă în această vară, astfel încât dezvoltatorii să poată experimenta. În plus, compania lansează noi previzualizări pentru text-to-speech pe modelele 2.5 Pro și 2.5 Flash prin intermediul API-ului Gemini, cu suport pentru două voci în 24 de limbi.