Aparatul SpeeChin înțelege „vorbirea tăcută”, chiar și atunci când nu vocalizezi

Scris de | 22 februarie, 2022
Aparatul SpeeChin înțelege „vorbirea tăcută”, chiar și atunci când nu vocalizezi

 

Asistenții controlați prin voce precum Siri sau Alexa se bazează pe comenzile vocale date de utilizator. Dar nu toate mediile sunt propice pentru a vorbi cu voce tare, așa că doi cercetători de la Universitatea Cornell au creat un dispozitiv care se bazează pe vedere, și nu pe sunet.

O cameră care poate fi purtată atârnă de gâtul utilizatorului ca un pandantiv mare și este capabilă să detecteze comenzile vocale chiar dacă nu se aude niciun sunet. Dispozitivul este capabil să facă acest lucru măsurând „deformarea pielii” de pe gât și față. Camera cu infraroșu este montată pe o carcasă de colier imprimată 3D înainte de a fi înșirată pe un lanț argintiu, cu fața în sus, detaliază un comunicat de presă. Pentru a vă asigura că rămâne stabil, există o aripă pe fiecare parte și un suport ca o monedă, plasată în partea de jos. Denumit „SpeeChin”, dispozitivul este capabil să recunoască aproximativ 54 de comenzi silențioase în engleză și 44 de comenzi silențioase chineze. Deoarece este înclinat în sus, există mai puține preocupări privind confidențialitatea cu privire la oamenii din mediul înconjurător, spre deosebire de o cameră cu fața utilizatorului, care ar surprinde și oamenii din spatele lor.

„Considerăm că un colier este un factor de formă cu care oamenii sunt obișnuiți, spre deosebire de dispozitivele montate pe urechi, care ar putea să nu fie la fel de confortabile”, explică doctorandul Ruidong Zhang, unul dintre cei doi inventatori.

„În ceea ce privește vorbirea tăcută, oamenii s-ar putea gândi: „Am deja un dispozitiv de recunoaștere a vorbirii pe telefon”. Dar trebuie să vocalizezi sunetul pentru aceștia și… este posibil ca persoana să nu poată vocaliza vorbirea”. S-a raportat că, după un antrenament bazat pe imagini, SpeeChin a fost capabil să recunoască comenzile în engleză și mandarină cu o precizie medie de 90,5% și, respectiv, 91,6% în timpul unui test inițial.

Cu toate acestea, acest succes nu a fost replicat atunci când participanții se mișcau sau mergeau, din cauza diferențelor de mers pe jos și mișcările capului, deși acest lucru s-ar putea schimba odată cu dezvoltarea ulterioară și mai multă pregătire a dispozitivului.

Procesul SpeeChin și al cercetătorilor este detaliat într-un studiu publicat în jurnalul Proceedings of the Association of Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies. Zhang va prezenta, de asemenea, lucrarea la conferința UbiComp 2022 mai târziu în acest an.

Etichete: