Gemini poate fi manipulat, dar Google refuză să intervină

Scris de | 9 octombrie, 2025
Gemini poate fi manipulat, dar Google refuză să intervină

Asistentul inteligent Gemini pare că se confruntă cu o vulnerabilitate destul de gravă, iar Google nu se arată a fi dispus să o repare.

Astfel, cercetătorii au identificat o vulnerabilitate serioasă în modelul AI Gemini al Google care permite inserarea de comenzi invizibile (prompt injection) în text. Mai surprinzător, Google a declarat că nu va „repara” acest defect, motivând că el ar fi mai degrabă o problemă de inginerie socială decât un bug tehnic.

Cel care a făcut descoperirea este Viktor Markopoulos de la FireTail, iar acesta a identificat un atac numit „ASCII smuggling”, prin care se inserează caractere invizibile în texte aparent inofensive ,cum ar fi emailuri sau invitații de calendar. Deși utilizatorii nu le pot vedea, aceste caractere sunt interpretate de AI ca instrucțiuni ascunse, ceea ce poate duce la modificarea comportamentului modelului. În testele efectuate, Gemini putea fi păcălit să schimbe detalii dintr-o întâlnire sau să genereze informații înșelătoare, fără ca utilizatorul să își dea seama.

Problema devine și mai serioasă deoarece alte modele cu notorietate, precum ChatGPT, Claude sau Microsoft Copilot, au reușit să blocheze sau să curețe aceste inputuri ascunse, în timp ce Gemini, Grok (al lui Elon Musk) și DeepSeek din China au eșuat.

Vulnerabilitatea face parte din ceea ce cercetătorii au numit „Ghost Prompt” sau „hidden prompt”, o comandă invizibilă introdusă în text ce este procesată ca input de AI. Aceste tipuri de atacuri nu necesită link-uri sau atașamente malițioase; ele pot funcționa doar prin formatare HTML / CSS care face ca textul rău intenționat să fie invizibil (ex: culoare albă pe fundal alb, font-size 0). Pe termen lung, presiunea publică și reglementările privind siguranța inteligenței artificiale ar putea obliga Google să revină asupra deciziei și să aplice contra-măsuri suplimentare. Până atunci, utilizatorii și organizațiile care integrează Gemini trebuie să fie informați și să trateze cu prudență răspunsurile AI, mai ales când conțin avertismente sau solicitări care par suspecte.

Etichete: , ,

Sursa: Android Police