Zaboravite Soru, ovo je AI tehnologija koja će vas oduševiti - a vrlo verovatno i uplašiti
Figure 01 je prikazan kako stoji iza stola na kojem se nalaze tanjir, jabuka i šolja, dok sa leve strane stoji sušilica
Napredak u razvoju humanoidnih robota, koji je do sada karakterisao spori tempo, dobio je impresivan zamah zahvaljujući saradnji između Figure AI i OpenAI. Rezultat ove kolaboracije predstavlja video koji ostavlja bez daha i pomera granice mogućeg u svetu veštačke inteligencije i robotike.
Startap kompanija Figure AI predstavila je u sredu novi video snimak svog robota Figure 01. Ovaj robot, opremljen najnovijim Vizuelnim jezičkim modelom (VLM) razvijenim od strane OpenAI, demonstrira sposobnosti koje ga svrstavaju u sam vrh tehnoloških dostignuća humanoidne robotike, približavajući se mogućnostima poznatog C-3PO iz sveta naučne fantastike.
U video materijalu, Figure 01 je prikazan kako stoji iza stola na kojem se nalaze tanjir, jabuka i šolja, dok sa leve strane stoji sušilica. Osoba postavlja pitanje robotu: "Figure 01, šta trenutno vidiš?" Nakon kratke pauze, robot odgovara izuzetno ljudskim glasom, detaljno opisujući sve predmete na stolu i osobu ispred sebe.
Zahtev za hranu od strane čoveka brzo je ispunjen kada Figure 01 sa lakoćom i preciznošću podiže jabuku i pruža je osobi. Sledeće, osoba baca smeće ispred robota tražeći objašnjenje za njegove akcije dok Figure 01 bez oklevanja vraća otpad u kantu, objašnjavajući da je jabuka odabrana jer je jedini jestivi predmet dostupan na stolu.
Ono što izdvaja Figure 01 nije samo sposobnost razumevanja i odgovaranja na govor, već i "govor-na-govor" rezonovanje koje omogućava OpenAI-jev VLM. Ova sposobnost omogućava robotu da interpretira slike i tekstove te da se osloni na celokupni razgovor za formiranje odgovora. Razlikuje se od prethodnih modela kao što je GPT-4, koji se fokusira isključivo na pisane zahteve.
Pored toga, Figure AI naglašava primenu "naučene bimanualne manipulacije" koja kombinuje precizno kalibrisane slike sa neuronskom mrežom radi kontrole pokreta. Ovaj sistem omogućava robota da u realnom vremenu interpretira vizuelne podatke i prilagodi svoje akcije, pokazujući da su sve prikazane radnje rezultat učenja sistema bez potrebe za upravljanjem iz pozadine.
Iako su tvrdnje kompanije Figure AI o autonomiji i sposobnostima Figure 01 impresivne, ostaje otvoreno pitanje o verodostojnosti bez ličnog iskustva i interakcije. Ipak, ukoliko su tvrdnje tačne, svet robotike i veštačke inteligencije mogao bi biti na pragu revolucionarnih promena.
(Telegraf.rs)