Veselin Jevrosimović: Višenačinski
Mnogo je zanimljiviji razlog zbog koga je ovaj pojam odjednom toliko bitan za sve nas
Ako vam se naslov ovog teksta učinio neobičnim, to je stoga što sam pokušao da na srpski jezik doslovno prevedem englesku reč „multimodal“.
Odgovarajući prevod je i „raznorodan“, ali se u praksi i kod nas kaže multimodalan ili multi modalan. Ako ni zbog čega drugog, ono da bismo lakše razumeli članke u stranim tehnološkim i naučnim medijima.
Mnogo je, ipak, zanimljiviji razlog zbog koga je ovaj pojam odjednom toliko bitan za sve nas.
Naime, radi se o multimodalnoj veštačkoj inteligenciji kao narednom koraku u razvoj modela mašinskog učenja i naprednih softverskih sistema.
Do sada smo imali priliku da testiramo pojedinačna specijalizovana rešenja. Tako, na primer, ČetGPT predstavlja generativni AI alat baziran na masivnom jezičkom modelu (eng. large language model, LLM). Budući da je mašina trenirana na ogromnom broju tekstova svih vrsta, može korišćenjem statističkih metoda da izvuče odgovore na mnoga pitanja.
Slično je i sa softverima koji mogu da generišu fotografije, video i audio zapise. Oni su naučeni da analiziraju sadržaje određene vrste, da prepoznaju detalje, da ih klasifikuju, obrađuju i kombinuju.
Zbog toga su svi dosadašnji sistemi veštačke inteligencije „jednonačinski“, odnosno uni modalni.
Kombinovanjem materijala različitih tipova, možemo da dobijemo multimodalnost kao put da veštačka inteligencija uči i razmišlja poput čoveka.
Doduše, do istinskog razmišljanja od strane kompjutera čeka nas dug put, ali sve institucije i kompanije koje se bave veštačkom inteligencijom uveliko rade na sledećoj generaciji multimodalnih mehanizama. To znači da ćemo kao upit moći da ponudimo različite vrste sadržaja, a raznorodni će biti i odgovori koje dobijamo. Još jedna velika prednost ovakvog pristupa jeste preciznost i sveobuhvatnost dobijenih rezultata.
Uostalom, slika govori više od hiljadu reči, zar ne?
Pisao sam već o tome da je univerzalna veštačka inteligencija (eng. artificial general intelligence, AGI) krajnje postignuće u ovoj oblasti. AGI, razumljivo, uključuje multimodalnost, ali i mnoge druge faktore i uslove koji moraju da budu ispunjeni da bi najnaprednija ljudska kreacija imala smisla i služila na dobrobit celog čovečanstva.
U članku napisanom pre dve godine, rekao sam da je potrebno da naučimo mašine da vole. Danas sam još čvršći u tom uverenju.
(Telegraf.rs/Veselin Jevrosimović)