Apple a lansat primul său AI: „MGIE”, un soi de Photoshop care preia comenzi în format text

Scris de | 8 februarie, 2024
Apple a lansat primul său AI: „MGIE”, un soi de Photoshop care preia comenzi în format text

Apple nu vorbește mult în public despre dezvoltarea tehnologiilor cu AI, dar asta nu înseamnă că nu lucrează la ele în secret. Compania a achiziționat în ultimii ani mai multe companii cu expertiză în acest domeniu, iar primul lucru care pare că iese din laboratoarele sale este un editor de fotografii open-source. Apple a colaborat cu cercetătorii Universității din California pentru a dezvolta proiectul MGIE, care poate fi testat chiar acum, gratuit.

MGIE sau MLLM-Guided Image Editing, este un editor de fotografii care dorește să ofere rezultate comparabile cu ceea ce vedem în Photoshop, dar folosind doar cuvinte. Poți cere AI-ului să decupeze, să taie, să adauge efecte sau să modifice anumite aspecte ale fotografiei, prin descrierea a ceea ce vrei să se întâmple în cuvinte.

MGIE ar putea fi integrat direct în iOS pe următoarele generații de iPhone-uri

Așa cum sugerează și numele, MGIE folosește un MLLM (Multimodal Large Language Model), similar cu ChatGPT sau Bard/Gemini de la Google, care poate genera și înțelege atât text, cât și imagini, sunete sau clipuri video. Astfel, AI-ul poate înțelege ceea ce vede într-o fotografie pe care i-o oferi pentru editare, poate prelua comenzile tale în format text și le poate apoi interpreta sub forma unor modificări aduse imaginii originale.

„Magia” unui AI care poate să îți modifice fotografii în acest fel este înțelegerea comenzilor în limbaj natural. Chiar dacă nu îi ceri să îți adauge anumite elemente sau să modifice parametri pe baza unor comenzi stricte, acesta poate interpreta descrierile în moduri creative. Un exemplu oferit de către cercetători în lucrarea care descrie MGIE este interpretarea comenzii „fă această pizza să arate mai sănătoasă”. În exemplul dat, era o pizza doar cu pepperoni, iar AI-ul a adăugat legume în locul unor felii de salam.

Dar poți cere AI-ului să facă și alte lucruri, precum schimbarea iluminării din imagine, adăugarea de reflexii, eliminarea unor obiecte, sau focalizarea pe obiecte care sunt în ceață.

O versiune demonstrativă a AI-ului MGIE de la Apple este disponibilă online, dar serverele sunt puține, iar timpul de așteptare pentru o generare este de peste o oră, la momentul redactării acestui articol, așa că nu am putut testa încă tehnologia. Se pare că există și un sistem de siguranță, pentru a nu genera imagini nepotrivite cu acest AI. În cazul unor prompt-uri neacceptate, imaginea rezultată va fi complet neagră.

Este ușor de intuit care este obiectivul Apple în această situație: integrarea unui AI de editare de acest gen direct în iPhone-uri, pentru a putea modifica și edita rapid fotografii realizate cu acestea. Cel mai probabil însă, o versiune de smartphone va putea fi controlată și prin voce, nu doar prin text.

Asus ROG Zephyrus g16 - 2024

Etichete: ,

Sursa: via Lifehacker