Veselin Jevrosimović: Tkanje i pređa podataka

Vreme čitanja: oko 2 min.

Mnogi stručnjaci se slažu da je „zagađenost podacima“ jedan od većih izazova vremena u kome živimo

Foto: Shutterstock.com

Smatram da nema naročite potrebe isticati koliko su podaci važni u digitalnom svetu. Oni su na neki način blagoslov i kletva modernog doba. Sa jedne strane, omogućuju nam uvid u nezamislivu količinu korisnih informacija, a sa druge nas zatrpavaju nepotrebnim i netačnim sadržajima.

Uostalom, mnogi stručnjaci se slažu da je „zagađenost podacima“ jedan od većih izazova vremena u kome živimo. Zbog toga se eksperti širom sveta trude da pronađu najbolje načine da se podaci organizuju i pravilno koriste.

Ovih se dana mnogo govori o veštačkoj inteligenciji i novim servisima koji polako ulaze u masovniju upotrebu. U pozadini modela kao što u ChatGPT i slični, nalaze se neverovatne količine relevantnih podataka na osnovu kojih je softver „treniran“ da donosi odluke, iznosi predviđanja i odgovara na pitanja.

Foto: Milena Đorđević

Iza svake ozbiljne poslovne odluke u velikim kompanijama krije se analiza najrazličitijih vrsta podataka koje se odnose na korisnike, konkurenciju, kretanja na tržištu i slično. Do nedavno je upravljanje ovim podacima bilo relativno jednostavno. Imali smo operativne podatke iz svakodnevnog poslovanja i istorijske podatke koji su korišćeni za analizu i predviđanja.

Poslovno izveštavanje (eng. business intelligence) koristi unapred pripremljene analitičke podatke da brzo ponudi odgovore na ključna pitanja. Takvi podaci čuvaju se u posebnim sistemima koji se obično nazivaju „skladište podataka“ (eng. data warehouse).

Kako se razvija tehnologija i raste obim sadržaja, klasična skladišta više nisu dovoljna. Zbog toga smo dobili nekoliko novih mehanizama.

Jedan od njih su „jezera podataka“ (eng. data lake) gde se podaci svih vrsta iz različitih izvora sakupljaju pre transformacije u korisne oblike.

Kada smo i to prerasli, govorimo o „mrežama podataka“ (eng. data mesh) i „tkanini podataka“ (eng. data fabric) kao višem nivou organizovanja i decentralizovanog upravljanja informacijama iz različitih izvora.

Postoje ideje da se u nekoj budućoj „mreži svih mreža“, nekom novom internetu, sve informacije čuvaju u struktuiranom obliku tako da njihovo korišćenja i obrada budu neuporedivo brži i precizniji.

Ako pogledamo obim i raznovrsnost podataka koji danas kruže svetom, teško je zamisliti kako bi to moglo da bude organizovano. Doduše, pre nekoliko decenija malo ko je mogao da predvidi internet, telekomunikacije i informacione tehnologije kojima danas raspolažemo.

(Telegraf.rs/Veselin Jevrosimović)