Veliki Jutjuberi besni: Apple i drugi bez dozvole koristili njihov sadržaj za obučavanje AI modela
Dok Apple i druge kompanije možda nisu direktno prekršile pravila, oslanjanje na dataset-ove trećih strana može dovesti do ozbiljnih etičkih i pravnih problema
Novi izveštaj otkriva da su velike tehnološke kompanije, uključujući Apple, koristile sadržaj sa YouTube-a za treniranje svojih modela veštačke inteligencije bez dozvole autora videa.
Prema izveštaju, Apple je iskoristio transkripte sa više od 170,000 videa koje je preuzela treća strana.
Među kreatorima čiji su sadržaji korišćeni bez pristanka nalaze se poznati imena poput Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver i Jimmy Kimmel.
Transkripti su preuzeti od strane neprofitne organizacije EleutherAI, koja tvrdi da pomaže u obuci AI modela. Iako je prvobitni cilj bio da se ovi materijali koriste za edukativne svrhe i male developere, u praksi su ih koristile i velike kompanije kao što su Apple, Nvidia i Salesforce.
Dokumenta pokazuju da su ove kompanije koristile dataset pod nazivom Pile, koji je sastavila EleutherAI. Pile dataset je javno dostupan svima sa dovoljno resursa da ga preuzmu i koriste za treniranje svojih AI modela.
Apple je koristio ovaj dataset za obučavanje svog OpenELM modela, koji je lansiran u aprilu, nedugo pre nego što su najavljene nove AI funkcije za iPhone i MacBook uređaje. Ovo otkriće podiže važna pravna pitanja o upotrebi materijala sa interneta za treniranje veštačke inteligencije.
Dok Apple i druge kompanije možda nisu direktno prekršile pravila, oslanjanje na dataset-ove trećih strana može dovesti do ozbiljnih etičkih i pravnih problema. Postoji sve veća zabrinutost zbog mogućnosti plagiranja i neovlašćenog korišćenja sadržaja prilikom treniranja AI modela.
(Telegraf.rs)