Opasno otkriće: Hakeri koriste veštačku inteligenciju za napade na veštačku inteligenciju - i uspeva im

Bilo je samo pitanje vremena kada će hakeri početi da koriste veštačku inteligenciju za napad na veštačku inteligenciju – i taj trenutak je konačno stigao. Novo istraživačko otkriće učinilo je napade ubrizgavanjem promptova (prompt injection) bržim, lakšim i zastrašujuće efikasnim, čak i protiv navodno sigurnih sistema poput Google Gemini modela.

Napadi ubrizgavanjem promptova predstavljaju jedan od najpouzdanijih načina za manipulaciju velikim jezičkim modelima (LLM). Ubacivanjem zlonamernih instrukcija u tekst koji AI čita – poput komentara u bloku koda ili sakrivenog teksta na veb stranici – napadači mogu naterati model da ignoriše svoja prvobitna pravila.

To može značiti curenje privatnih podataka, davanje pogrešnih odgovora ili izvršavanje drugih neželjenih ponašanja. Međutim, problem je što napadi ubrizgavanjem promptova tipično zahtevaju mnogo "ručnih" pokušaja i grešaka da bi uspeli, posebno kod modela zatvorene arhitekture kao što su GPT-4 ili Gemini, gde programeri ne mogu da vide izvorni kod ili podatke za treniranje.

Nova tehnika pod nazivom "Fun-Tuning", ipak, sve to menja. Razvijena od strane tima univerzitetskih istraživača, ova metoda koristi Google API za fino podešavanje Gemini modela kako bi automatski kreirala ubrizgavanja promptova sa visokom stopom uspeha. Nalazi istraživača trenutno su dostupni u preliminarnom izveštaju.

AI oružje koje samo sebe usavršava

Zloupotrebom interfejsa za treniranje Gemini modela, Fun-Tuning pronalazi najbolje "prefikse" i "sufikse" kojima će obuhvatiti zlonamerni prompt napadača, dramatično povećavajući šanse da će biti izvršen. Rezultati napada govore sami za sebe.

U testiranju, Fun-Tuning je postigao stopu uspeha do 82 procenta na nekim Gemini modelima, u poređenju sa manje od 30 procenta kod tradicionalnih napada. Radi tako što iskorišćava suptilne tragove u procesu finog podešavanja – poput toga kako model reaguje na greške u treniranju – i pretvara ih u povratne informacije koje usavršavaju napad. Možemo ga zamisliti kao sistem navođenja raketa sa veštačkom inteligencijom, ali za napade ubrizgavanjem promptova.

Još više zabrinjava činjenica da se napadi razvijeni za jednu verziju Gemini modela lako prenose na druge. To znači da jedan napadač potencijalno može razviti jedan uspešan prompt i implementirati ga na više platformi. A pošto Google nudi ovaj API za fino podešavanje besplatno, trošak izvođenja takvog napada iznosi svega oko 10 dolara za računarsko vreme.

Google je priznao pretnju, ali nije komentarisao da li planira da promeni svoje funkcije za fino podešavanje. Istraživači iza Fun-Tuning upozoravaju da odbrana od ove vrste napada nije jednostavna – uklanjanje ključnih podataka iz procesa treniranja učinilo bi alat manje korisnim za programere. Ali ostavljanje istih olakšava napadačima da ih iskoriste.

Jedno je sigurno - napadi ubrizgavanjem promptova poput ovog znak su da je igra ušla u novu fazu, gde veštačka inteligencija nije samo meta, već i oružje.

(Telegraf.rs)

Opasno otkriće: Hakeri koriste veštačku inteligenciju za napade na veštačku inteligenciju - i uspeva im

AI oružje koje samo sebe usavršava

Video: Građani Šapca treba da budu spokojni, ne očekujemo značajnija dešavanja vezano za izlivanje reka

Teme

Komentari

Najnovije iz rubrike Hi-Tech

Edukacija

Veselin Jevrosimović: Ugljenik i silicijum

Info Tech

Anker otvara prodavnicu u Beogradu – svoju prvu prodavnicu u Evropi

Video Igre

Jedna od najičekivanijih PlayStation igara ove godine dobila datum izlaska: Evo kada stiže Ghost of Yōtei

Jak zemljotresu na istoku Turske, kod grada Malatija

Ovo je dokaz da je Partizan bez Natha "ništa", Izraelac opet pokazao kako se izvode slobodnjaci

Ovo je mladić poreklom iz BiH koji je iskasapio muslimana tokom molitve u džamiji: Francuska na nogama

Juve i bez Vlahovića do tri važna boda: Stara dama se drži u borbi za Ligu šampiona, srušili "fenjeraša"

Milojević zadovoljan posle trijumfa: "Bilo mi je važno da igrači pokažu reakciju posle Kragujevca"

Uživo <% item.title %>

Opasno otkriće: Hakeri koriste veštačku inteligenciju za napade na veštačku inteligenciju - i uspeva im

Preporučujemo

Sem Altman se žali da kada postanete milijarder "svi vas mrze zbog svega"

Bil Gejts: "Za 10 godina AI će zameniti lekare i nastavnike — ljudi neće biti potrebni za većinu stvari"

AI oružje koje samo sebe usavršava

Povezane vesti

Porastao broj žrtava napada na festivalu u Vankuveru: "Uzdrman je kolektivni osećaj sigurnosti"

Kako veštačka inteligencija zamišlja nove alate za slušanje kosmosa?

"Veštačka inteligencija je kao mladunče tigra, moramo biti zabrinuti": Nobelovac Džefri Hinton upozorava na AI

Najmanje 20 ljudi ubijeno, desetine ranjeno u napadu bande: Užas u Nigeriji

Video: Građani Šapca treba da budu spokojni, ne očekujemo značajnija dešavanja vezano za izlivanje reka

Podelite vest:

Teme

Komentari

Priče sa Weba

BUKNUO OGROMAN POŽAR, ODJEKUJU DETONACIJE! Grom udario u stambeni objekat na Novom Beogradu: Od dima se ništa ne vidi, miris paljevine se oseća čak i CENTRU GRADA (FOTO, VIDEO)

TRAMP, ZELENSKI I BAJDEN NA ISTOM MESTU, ZA DLAKU IZBEGNUT SKANDAL! Sahranjen papa Franja, 400.000 ljudi u Rimu: Protokol promenjen u POSLEDNJEM TRENUTKU (FOTO, VIDEO)

(MAPE) POTPUNI OBRT! Ništa od "bečkih vrata" za Prvi maj, stiže anticiklon iz Afrike: Naš meteorolog objašnjava šta to znači

FOTOGRAFIJA KOJA JE RAZBESNELA SVET Ljudi ne mogu da veruju šta svetski lideri rade dok prolazi kovčeg sa telom pape Franje (FOTO)

Najnovije iz rubrike Hi-Tech

Edukacija

Veselin Jevrosimović: Ugljenik i silicijum

Info Tech

Anker otvara prodavnicu u Beogradu – svoju prvu prodavnicu u Evropi

Video Igre

Jedna od najičekivanijih PlayStation igara ove godine dobila datum izlaska: Evo kada stiže Ghost of Yōtei