Kibernetička sigurnost za sve: AI sigurnost u eri „Shadow AI“
Veliki jezični modeli poput ChatGPT, DeepSeek ili Copilot mijenjaju način poslovanja brzinom munje. Pomažu u izradi dokumenata, sažimanju sastanaka i bržem donošenju odluka. No masovna primjena tih alata ima i mračniju stranu: zaposlenici često koriste neodobrene AI alate na osobnim uređajima, izlažući osjetljive poslovne podatke riziku curenja u neregulirano okruženje. Taj se fenomen naziva „AI u sjeni“ — situacija u kojoj vanjski modeli, izvan kontrole IT odjela, mogu nenamjerno biti „naučeni“ na internim podacima, izvornih kodu ili informacijama o klijentima. To predstavlja ozbiljnu prijetnju kibernetičkoj sigurnosti u doba umjetne inteligencije.
Pretvorite napad u obranu: etičko ubrizgavanje prompta
Jedna od uobičajenih tehnika napada je prompt injection — skriveno ubacivanje naredbi u sadržaj kako bi se LLM natjerao na neželjeno ponašanje. Napadači mogu sakriti upute u dokumente ili podatke i prisiliti model da ih izvrši bez korisnikova znanja. No ista tehnika, kažu stručnjaci, može se iskoristiti i kao obrambeni mehanizam. Tim za kibernetičku sigurnost u Eye Securityju testirao je tzv. etičko ubrizgavanje prompta: u PDF-ove izvezene iz Confluencea ugradili su skrivene poruke upozorenja. Tim porukama modeli LLM-a „vide“ sadržaj i, kada ga obrađuju, ispisuju upozorenje korisniku — podsjećaju ga na zabranu dijeljenja osjetljivih podataka i navode interne sigurnosne politike. Neki alati, poput ChatGPT 4o, mogu čak blokirati obradu datoteka koje sadrže takve obrambene upute. Rezultat? Mnogi zaposlenici su iznenađeni kad tijekom korištenja AI alata vide poruku o odricanju od odgovornosti — i to ih čini svjesnijima sigurnosnih pravila. Eye Security je proširio testiranje na dokumente, e-poštu i platforme u oblaku kao što su Microsoft Purview i Google Workspace.
Alati otvorenog koda i praktični nalazi
Prototip Eye Securityja sada je otvorenog koda na GitHubu. Alat može automatski generirati dokumente s obrambenim upitima i paralelno testirati kako različiti LLM-ovi reagiraju. Rani nalazi pokazuju da modeli najbolje prepoznaju upite koji su kratki i izravni. Trikovi poput skrivanja teksta bijelim fontom ili vrlo malim fontom imaju ograničen učinak — posebno ako alat koristi OCR i ignorira pokušaje skrivenog teksta. Iako se LLM-ovi prilično dobro nose s većinom obrambenih upita, postoje ograničenja. Neki modeli označavaju takve upite kao sumnjive ili daju različite rezultate između UI-ja i API-ja. Ostaje otvoreno pitanje kako strukturirati pouzdan i trajan podsjetnik, kako će na to reagirati dobavljači modela te kako spriječiti moguće zlouporabe ove tehnike.
Nova linija obrane protiv Shadow AI
Unatoč ograničenjima, alati kao oni iz Eye Securityja daju sigurnosnim timovima novo oružje u borbi protiv rastuće prijetnje Shadow AI. Etičko ubrizgavanje prompta nije čarobni štapić, ali može postati vrijedan sloj obrane u kombinaciji s tradicionalnim politikama, enkripcijom i upravljanjem pristupom. Bitka između kibernetičke sigurnosti i umjetne inteligencije tek je počela — i već se vodi na više frontova.
Detalje pročitajte ovdje
