Sjajno ili jezivo? Ovo je novi AI model koji pretvara fotografije u "lica koja govore"
Ova tehnologija, iako još uvek nije dostupna javnosti, impresionirala je demo verzijama svojim realističnim pokretima lica i sinhronizacijom usana
Novi AI model kompanije Microsoft, VASA-1, obećava revolucionarnu promenu u načinu kreiranja animiranih "lica koja govore" iz običnih fotografija. Model koristi kombinaciju jedne portretne fotografije i audio zapisa za kreiranje hiperrealističnog videa koji prikazuje kako lice na fotografiji govori u realnom vremenu.
Ova tehnologija, iako još uvek nije dostupna javnosti, impresionirala je demo verzijama svojim realističnim pokretima lica i sinhronizacijom usana.
VASA-1 se izdvaja od sličnih tehnologija koje nude kompanije kao što su Runway i Nvidia, pružajući znatno bolji kvalitet i realističnost. Zanimljivo je da za stvaranje animacije nije neophodna fotografija lica koje gleda direktno u kameru; model uspešno funkcioniše čak i sa slikama lica snimljenih pod različitim uglovima. Takođe, model omogućava kontrolu nad pravcem pogleda očiju, udaljenosti glave i čak emocijama, što otvara nove mogućnosti za njegovu primenu.
VASA-1 bi mogao da nađe široku primenu u različitim industrijama. U video igrama, ovaj model može unaprediti realizam NPC-jeva, čineći njihove facijalne ekspresije i pokrete usana tokom govora izuzetno uverljivim. Osim toga, VASA-1 bi mogao da bude koristan u kreiranju virtuelnih avatara za društvene mreže, kao i u produkciji filmova ili muzičkih spotova koji koriste AI, gde bi ovaj model mogao da stvara potpuno realistične likove koji pevaju i pokazuju emocije.
Međutim, postoji i potencijalna opasnost od zloupotrebe ove tehnologije, posebno u kontekstu deepfake sadržaja. Mogućnost da se kreira izuzetno realističan video materijal sa ljudskim licima može dovesti do problema u autentičnosti sadržaja i širenja dezinformacija.
Impresivne mogućnosti VASA-1 i dalje intrigiraju istraživače i javnost, iako je trenutno dostupan samo timu unutar Microsoft Research-a. Razvoj ovakvih tehnologija ukazuje na budućnost u kojoj bi interakcija sa digitalnim svetom mogla postati znatno prirodnija i intuitivnija.
(Telegraf.rs)