Google anunță lansarea Gemini 2.0, primul upgrade generațional al LLM-ului său multimodal. Pentru început, Gemini 2.0 Flash va fi disponibil în browser și în căutările de pe Google, însă va fi eventual integrat în toate aplicațiile și serviciile web sau mobile în care AI-ul companiei este prezent. Se pare că Gemini 2.0 nu va îmbunătăți cu foarte mult capabilitățile, ci este un update care se concentrează pe viteză și pe îmbunătățirea rezultatelor obținute prin intermediul AI-ului.
Gemini 2.0 Flash accelerează răspunsurile de calitate înaltă cu AI în serviciile Google
Gemini 2.0 Flash se laudă cu performanță mult mai bună decât 1.5 Flash, versiunea de LLM pe care o înlocuiește, dar cu viteză dublă de răspuns față de Gemini 1.5 Pro. Acest LLM este compatibil cu cerințe în format text, foto, video sau audio și poate genera imagini, text sau răspunsuri în format audio. Primii care vor putea încercat Gemini 2.0 Flash sunt dezvoltatorii software, întrucât va fi integrat în Google AI Studio și Vertex AI, și cei care folosesc Gemini în browser și în rezumatele cu AI din căutări. Din ianuarie, noul LLM va fi disponibil și pentru publicul larg, în aplicația de mobil.

Îmbunătățirile Gemini 2.0 vor fi transferate și la alte produse AI la care Google lucrează. De exemplu, Project Astra, un asistent AI universal, primește odată cu Gemini 2.0 posibilitatea de a susține dialoguri în mai multe limbi simultan, pentru cei care folosesc termeni din alte limbi în vorbirea normală, de exemplu, cât și integrare mai bună cu alte servicii Google precum Lens sau Maps. Asistentul va putea răspunde în context în conversații de până la 10 minute, în timp ce latența de răspuns va fi scăzută pentru a oferi conversații cât mai naturale.
Project Mariner, care este un AI de tip „agent”, care poate realiza sarcini în browser-ul Chrome, poate să înțeleagă ceea ce vede pe ecran (imagini, cod sau text) și poate să realizeze anumite sarcini pe care i le dai cu ajutorul unei extensii de browser. Google promite însă că AI-ul nu va acționa fără confirmări ferme din partea utilizatorilor pentru acțiuni sensibile, precum schimbarea tab-ului sau introducerea anumitor de date.
Agenții, următorul pas în dezvoltarea capabilităților AI
Google vorbește despre agenți AI pentru dezvoltatori software (Jules) și despre integrarea AI în jocuri sau chiar dezvoltarea de jocuri cu ajutorul AI. Genie 2 poate, de exemplu, să genereze lumi 3D interactive pe baza descrierilor text, iar jocurile rezultate nu sunt bazate pe ceea ce putem considera „game development” tradițional. Totul este generat în timp real, fără cod, fără modele 3D, texturi etc.
Verisunea Flash este doar începutul lansării Gemini 2.0. Google a demonstrat în trecut că poate crea diverse versiuni, mai rapide, mai complexe sau care pot realiza sarcini mai avansate, iar Flash este doar începutul, versiunea de bază a noii generații. Probabil că cei care folosesc Gemini pentru muncă vor aștepta cu interes versiunea Gemini 2.0 Pro pentru îmbunătățiri semnificative în analiza de documente.
Odată cu Gemini 2.0 Flash, Google anunță și Deep Research pentru Gemini 1.5 Pro pentru abonații Advanced. Acesta este un nou mod pentru cei care vor să accelereze procesul de cercetare într-un anumit domeniu. Poți realiza o listă cu cerințe de care ai nevoie, iar Gemini va căuta pe internet toate informațiile relevante și le va structura pentru a fi ușor de parcurs. Deep Research poate exporta documente și tabele în Google Docs cu rezultatele, și oferă toate sursele de unde a luat informațiile relevante. Probabil că această funcție va putea oferi rezultate și mai bune atunci când va trece la Gemini 2.0.