Microsoft je "ispod radara" predstavio novu veštačku inteligenciju koja će izazvati jezu kod mnogih

18/01/23 | 12:30

TTS je visoko konkurentna niša koja uključuje druge teškaše kao što su Google, Amazon i Meta

Foto: Pixabay.com

Microsoft istraživači rade na modelu pretvaranja teksta u govor (TTS – text-to-speech) koji može da oponaša nečiji glas – zajedno sa emocijama i intonacijom – nakon samo tri sekunde obuke.

Tehnologija – nazvana VALL-E i opisana u istraživačkom radu od 15 stranica objavljenom ovog meseca na istraživačkom sajtu arXiv – predstavlja značajan korak napred za Microsoft.

TTS je visoko konkurentna niša koja uključuje druge teškaše kao što su Google, Amazon i Meta.

U radu, istraživači tvrde da, iako je uspon neuronskih mreža i end-to-end modeliranja brzo poboljšao tehnologije oko sinteze govora, i dalje postoje problemi sa sličnošću korišćenih glasova i nedostatkom prirodnih govornih obrazaca u TTS-u. proizvodi.

Oni nisu robotski glasovi od pre deceniju ili dve, ali takođe ne izgledaju kao potpuno ljudski, prenosi PC Press.

Drugi TTS sistemi se obučavaju koristeći desetine sati podataka jednog govornika ili stotine sati sa podacima sa više govornika. VALL-E može da zadrži akustično okruženje glasa.

Dakle, ako je isečak glasa koji se koristi kao akustični odzivnik u modelu snimljen na telefonu, sintetizovani izgovoreni tekst bi takođe zvučao kao da dolazi preko telefona. Hvatanje emocija je slično, tvrde istraživači.

Ako sekunde snimljenog glasa akustičnog odziva izazivaju ljutnju, onda će sintetizovani govor zasnovan na tom glasu takođe prikazati bes.

Rezultat je TTS model koji nadmašuje druge u oblastima kao što su govor prirodnog zvuka i sličnost govornika. Testiranje takođe pokazuje da je "sintetizovani govor nevidljivih govornika prirodan kao i ljudski snimci", tvrde oni.

Patrik Har, izvršni direktor kompanije za borbu protiv fišinga SlashNext, rekao je da bi TTS takođe mogao postati još jedan alat za sajber kriminalce, koji bi ga mogli koristiti za vishing kampanje – napade pomoću lažnih telefonskih poziva ili glasovnih poruka za koje se smatra da potiču od kontakta koji žrtva poznaje.

Takođe bi se mogao koristiti u tradicionalnijim phishing napadima.

Microsoft istraživači su primetili rizik od sintetizovanog govora koji zadržava identitet govornika. Rekli su da bi bilo moguće napraviti model detekcije kako bi se utvrdilo da li je audio snimak stvaran ili sintetizovan pomoću VALL-E.

(Telegraf.rs)

Teme

Pošaljite komentar

Sve vesti iz rubrike Hi-Tech

Microsoft je "ispod radara" predstavio novu veštačku inteligenciju koja će izazvati jezu kod mnogih

TTS je visoko konkurentna niša koja uključuje druge teškaše kao što su Google, Amazon i Meta

Preporučujemo

NASA je već najavila naslednika James Webb-a koji će tražiti život na vanzemaljskim planetama

Ovim laserima ogromne snage mogli bismo da kontrolišemo gromove: Naučnici uspešno sproveli test

Teme

Microsoft je "ispod radara" predstavio novu veštačku inteligenciju koja će izazvati jezu kod mnogih

TTS je visoko konkurentna niša koja uključuje druge teškaše kao što su Google, Amazon i Meta

Preporučujemo

NASA je već najavila naslednika James Webb-a koji će tražiti život na vanzemaljskim planetama

Ovim laserima ogromne snage mogli bismo da kontrolišemo gromove: Naučnici uspešno sproveli test

Teme

Povezane vesti

Ljudi se masovno zaljubljuju u veštačku inteligenciju: Stručnjaci upozoravaju na opasne posledice

Opasno otkriće: Hakeri koriste veštačku inteligenciju za napade na veštačku inteligenciju - i uspeva im

Bil Gejts: "Za 10 godina AI će zameniti lekare i nastavnike — ljudi neće biti potrebni za većinu stvari"

Direktor OpenAI upozorio: "Možda će nam trebati manje programera" jer AI preuzima kodiranje

Veoma moćna veštačka inteligencija stiže brže nego što mislimo - i nismo spremni za to

Od ovog datuma će Amazon slušati sve što kažete Alexi - i ne možete to sprečiti

Tražili ga Amazon i Meta, sve ih je odbio da bi pomagao programerima da varaju na razgovorima za posao

Samosvesni roboti sada mogu da uče kao ljudi: Naučnici napravili ogroman preokret u robotici

Ovo su Majls i Maja: AI glasovi koji su preplašili internet koliko zvuče kao ljudi

Glavni arhitekta NVIDIA otkriva surovu istinu: "Izazovno vreme za mlade programere" - ove 2 veštine su ključne

Video dana

Košarkaš Klipersa nokautirao Jokića, srpski as skočio na sudije pa dobio tehničku grešku

Blagodatni oganj i Vaskršnja liturgija u Jerusalimu

Jokićeva vrhunska asistencija zbunila odbranu Klipersa

Najnovije iz rubrike Hi-Tech

Da li veštačka inteligencija može da sprovodi psihoterapiju?

Veselin Jevrosimović: Bezbednost pre svega

Web3 revolucija za kreatore je počela – SUBBD ICO bi mogao biti najveća opklada 2025. godine

Charles Hoskinson predviđa Bitcoin na 250000 dolara u 2025. – Ali kriptovaluta bi mogla doneti još veći profit

Pre nego što je Arbitrum eksplodirao, bio je samo opklada – Solaxy bi mogao biti Solanin trenutak