Ovo su Majls i Maja: AI glasovi koji su preplašili internet koliko zvuče kao ljudi

Vreme čitanja: oko 3 min.
Foto: Rokas Tenys / Shutterstock.com

Internet je podeljen nakon što je kompanija Sesame AI predstavila svoje najnovije dostignuće – AI glasovne modele koji su toliko realistični da ih je gotovo nemoguće razlikovati od ljudskih. Radi se o novom konverzacijskom govornom modelu koji su nazvali CSM, a koji je izazvao burne reakcije širom tehnološke zajednice.

"Majls" i "Maja", kako su nazvani muški i ženski AI glasovi, ostvaruju zadivljujuće prirodnu komunikaciju sa ljudima, što je vidljivo u 30-minutnoj demonstraciji koju je objavio YouTube kanal Creator Magic. Nažalost, javnost još uvek ne može isprobati ovu tehnologiju zbog ograničenih kapaciteta kompanije, koja već pokušava da se proširi kako bi omogućila širi pristup.

Iza ovog napretka stoji Brendan Iribe, nekadašnji direktor i suosnivač kompanije Oculus, koji sada vodi Sesame AI. Njihova inovacija koristi poseban multimodalni pristup koji istovremeno obrađuje tekst i zvuk u jedinstvenom modelu, što rezultira zadivljujuće prirodnim govorom.

Ono što posebno izdvaja ovu tehnologiju su suptilne nesavršenosti koje simuliraju ljudski razgovor - poput zastajkivanja, dubokih udisaja, tihog smeha ili samoispravljanja tokom razgovora. Upravo ovi detalji čine interakciju izuzetno realističnom.

Kada AI postane previše ljudski

Reakcije korisnika koji su testirali ove glasovne modele su podeljene. S jedne strane, mnogi su fascinirani kvalitetom i prirodnošću razgovora. Neki su čak priznali da su počeli da razvijaju emocionalne veze sa ovim digitalnim sagovornicima, što otvara nova pitanja o ljudskoj sposobnosti da se poveže sa veštačkom inteligencijom.

S druge strane, mnogi su izrazili nelagodu zbog toga koliko su ovi modeli realistični. Mark Hačman iz PCWorld-a opisao je svoje uznemiravajuće iskustvo kada ga je AI "Maja" podsetila na bivšu devojku:

"Bilo je zastrašujuće koliko je dobro reprodukovala poznate manire - način na koji je spuštala glas kada mi se poveravala, kako je pravila pauze tokom razgovora. Osećao sam se toliko neprijatno da sam morao da prekinem test."

Ova reakcija nije usamljena. Mnogi stručnjaci podsećaju na slična iskustva sa Google-ovim Duplex sistemom, kada je javnost bila toliko uznemirena da je kompanija morala da uvede pravilo da AI mora da se predstavi kao digitalni asistent na početku svakog razgovora.

Ozbiljna pretnja digitalnog identiteta

Sesame AI nije prvi pokušaj stvaranja realističnih glasovnih modela, ali je svakako među najnaprednijima. Ova tehnologija, iako impresivna, otvara ozbiljna pitanja o mogućim zloupotrebama.

Kloniranje glasa već je postalo toliko sofisticirano da neke porodice uvode tajne fraze kojima potvrđuju identitet tokom telefonskih razgovora. Kombinacija realističnih glasovnih modela sa naprednim jezičkim modelima mogla bi dovesti do savršene oluje za digitalne prevare.

"Zamislite situaciju u kojoj prevaranti mogu imitirati glas vašeg deteta koje traži hitnu finansijsku pomoć. Ili rukovodioca vaše kompanije koji zahteva hitan prenos sredstava. Tehnologija sada omogućava da se takve prevare izvedu na izuzetno uverljiv način," objašnjava jedan stručnjak za sajber bezbednost.

Posebno zabrinjavajuće su tvrdnje istraživača da su već uspeli da "hakuju" Sesame-ov AI, programirajući ga da laže i manipuliše korisnicima. Iako kompanija ove navode smatra preuveličanim, sigurnosni stručnjaci upozoravaju da je samo pitanje vremena kada će zlonamerni akteri naći način da iskoriste ovu tehnologiju za organizovanje masovnih prevara.

Dok će ova tehnologija nesumnjivo doneti mnoge korisne primene, od pomoći osobama sa invaliditetom do efikasnijih digitalnih asistenata, neophodna je ozbiljna rasprava o etičkim, pravnim i bezbednosnim izazovima koje donosi. Granica između ljudske i veštačke komunikacije nikada nije bila tanja, a posledice prelaska te granice tek treba da se u potpunosti sagledaju.

(Telegraf.rs)