Sjajno ili jezivo? Ovo je novi AI model koji pretvara fotografije u "lica koja govore"

Vreme čitanja: oko 1 min.

Ova tehnologija, iako još uvek nije dostupna javnosti, impresionirala je demo verzijama svojim realističnim pokretima lica i sinhronizacijom usana

Foto: Microsoft VASA-1 AI

Novi AI model kompanije Microsoft, VASA-1, obećava revolucionarnu promenu u načinu kreiranja animiranih "lica koja govore" iz običnih fotografija. Model koristi kombinaciju jedne portretne fotografije i audio zapisa za kreiranje hiperrealističnog videa koji prikazuje kako lice na fotografiji govori u realnom vremenu.

Ova tehnologija, iako još uvek nije dostupna javnosti, impresionirala je demo verzijama svojim realističnim pokretima lica i sinhronizacijom usana.

VASA-1 se izdvaja od sličnih tehnologija koje nude kompanije kao što su Runway i Nvidia, pružajući znatno bolji kvalitet i realističnost. Zanimljivo je da za stvaranje animacije nije neophodna fotografija lica koje gleda direktno u kameru; model uspešno funkcioniše čak i sa slikama lica snimljenih pod različitim uglovima. Takođe, model omogućava kontrolu nad pravcem pogleda očiju, udaljenosti glave i čak emocijama, što otvara nove mogućnosti za njegovu primenu.

VASA-1 bi mogao da nađe široku primenu u različitim industrijama. U video igrama, ovaj model može unaprediti realizam NPC-jeva, čineći njihove facijalne ekspresije i pokrete usana tokom govora izuzetno uverljivim. Osim toga, VASA-1 bi mogao da bude koristan u kreiranju virtuelnih avatara za društvene mreže, kao i u produkciji filmova ili muzičkih spotova koji koriste AI, gde bi ovaj model mogao da stvara potpuno realistične likove koji pevaju i pokazuju emocije.

Međutim, postoji i potencijalna opasnost od zloupotrebe ove tehnologije, posebno u kontekstu deepfake sadržaja. Mogućnost da se kreira izuzetno realističan video materijal sa ljudskim licima može dovesti do problema u autentičnosti sadržaja i širenja dezinformacija.

Impresivne mogućnosti VASA-1 i dalje intrigiraju istraživače i javnost, iako je trenutno dostupan samo timu unutar Microsoft Research-a. Razvoj ovakvih tehnologija ukazuje na budućnost u kojoj bi interakcija sa digitalnim svetom mogla postati znatno prirodnija i intuitivnija.

(Telegraf.rs)