Kako AURA mijenja igru kibernetičke sigurnosti čineći ukradene AI podatke beskorisnima
Međunarodni istraživački tim za kibernetičku sigurnost razvio je inovativnu obrambenu tehniku koja ne pokušava samo spriječiti krađu podataka, već ide korak dalje i čini ukradene AI baze podataka praktički beskorisnima. Umjesto klasične obrane, nova metoda aktivno potkopava vrijednost ukradenih podataka, uzrokujući da ih napadači ne mogu učinkovito iskoristiti.
Riječ je o zaštitnom okviru nazvanom AURA, odnosno Active Utility Reduction via Falsification, koji su razvili znanstvenici s Instituta za informacijsko inženjerstvo Kineske akademije znanosti, Nacionalnog sveučilišta Singapura i Tehnološkog sveučilišta Nanyang. AURA je osmišljena za zaštitu vlasničkih grafova znanja, koji predstavljaju temelj sustava Graph Retrieval-Augmented Generation, poznatih kao GraphRAG, a koji se intenzivno koriste u farmaceutskoj industriji i velikim tehnološkim kompanijama.
Vlasnički grafovi znanja predstavljaju ogromnu investiciju u intelektualno vlasništvo, pri čemu troškovi njihove izgradnje mogu premašiti 120 milijuna američkih dolara. Upravo zbog te vrijednosti sve su češće meta kibernetičkih kriminalaca i insajderskih prijetnji. Poznati primjeri uključuju krađu više od 14.000 povjerljivih datoteka koju je počinio bivši Waymo inženjer, kao i kibernetički napad na Europsku agenciju za lijekove 2020. godine, tijekom kojeg su procurili osjetljivi podaci vezani uz cjepivo Pfizer-BioNTech.
U takvom okruženju tradicionalne sigurnosne mjere, poput pečatiranja autorskih prava ili enkripcije, sve češće pokazuju ozbiljna ograničenja. U slučajevima kada napadač koristi ukradene podatke u privatnom, izoliranom okruženju, ove metode postaju gotovo neučinkovite. Osim toga, enkripcija često uzrokuje značajno računalno opterećenje i povećanu latenciju, što otežava korištenje AI sustava u stvarnom vremenu.
Kako AURA funkcionira
AURA okvir koristi četverostupanjski proces koji namjerno narušava kvalitetu ukradenih podataka, dok istovremeno osigurava da ovlašteni korisnici mogu normalno koristiti sustav. Prvi korak uključuje identifikaciju ključnih čvorova unutar grafa znanja pomoću naprednih analitičkih algoritama. Zatim sustav generira strukturirane, ali činjenično netočne informacije kombinirajući prediktivne modele s velikim jezičnim modelima, stvarajući lažne podatke koji se prirodno uklapaju u stvarni skup podataka.
U trećoj fazi AURA bira takozvane iskrivljujuće čimbenike, odnosno lažne elemente koji imaju najveći potencijal za narušavanje točnosti AI rezultata. To se mjeri pomoću Semantičkog rezultata pristranosti, koji procjenjuje koliko pojedini lažni podatak može utjecati na izlaz modela. U završnoj fazi koristi se mehanizam enkripcije koji ovlaštenim korisnicima, uz pomoć privatnog ključa, omogućuje uklanjanje svih izmijenjenih podataka, čime se osigurava potpuno ispravno i neometano funkcioniranje sustava.
Dokazana učinkovitost u praksi
Testiranje AURA-e provedeno je na četiri standardna skupa podataka i više AI modela, uključujući GPT-4o, Gemini-2.5 Flash, Qwen-2.5-7B i Llama2-7B. Rezultati su pokazali izrazitu učinkovitost. Točnost neovlaštenih sustava pala je na svega 4,4 do 5,3 posto, dok je razina štete za napadače dosljedno prelazila 94 posto. Istovremeno, ovlašteni korisnici zadržali su stopostotnu točnost u odnosu na izvorni sustav, uz minimalne operativne troškove i povećanje latencije upita manje od 14 posto.
Prikrivenost i otpornost AURA-e
Jedna od ključnih prednosti AURA-e jest njezina prikrivenost. Miješani podaci koje sustav generira izuzetno su teški za otkrivanje, čak i uz pomoć alata za detekciju strukturnih i semantičkih anomalija, pri čemu je stopa detekcije manja od 4,1 posto. Čak i nakon sofisticiranih pokušaja čišćenja podataka, više od 80 posto izmijenjenih elemenata ostaje u grafu znanja, dok točnost neovlaštenih AI sustava ostaje ispod 17,7 posto.
Zanimljivo je i to da učinkovitost AURA-e raste s kompleksnošću upita. Kod složenih pitanja koja zahtijevaju višestupanjsko zaključivanje i povezivanje više odnosa unutar grafa znanja, razina štete povećava se s 94,7 posto kod jednostavnih upita na 95,8 posto kod trostupanjskih upita.
Ova studija predstavlja značajan zaokret u razmišljanju o kibernetičkoj sigurnosti, jer fokus pomiče s pasivnog otkrivanja krađe na aktivno smanjivanje ekonomske vrijednosti ukradenog intelektualnog vlasništva. Umjesto da se isključivo pokušava spriječiti upad, AURA napadačima oduzima smisao krađe, čineći ukradene AI baze podataka neučinkovitima i ekonomski neisplativima. Time se nudi praktičan i dugoročno održiv obrambeni mehanizam u doba kada grafovi znanja čine temelj ključnih poslovnih aplikacija, od otkrivanja lijekova
