Je li OpenAI prekršio GDPR zakon o privatnosti?
Neprofitna organizacija Maxa Schremsa, Noyb, podnijela je tužbu protiv OpenAI-ja zbog mogućeg kršenja GDPR-a. Žale se austrijskom regulatoru privatnosti DSB tražeći istragu prakse obrade podataka OpenAI-ja i provjeru jesu li poduzete mjere za osiguranje točnosti prikupljenih podataka.
Slučaj se fokusira na “halucinacije” ChatGPT-a i nemogućnost ispravka dezinformacija. Noyb tvrdi da je ChatGPT pružio netočne podatke o osobnim podacima nepoznate “javne osobe”. Točnije rečeno, radi se o netočnom datumu rođenja te osobe. Kada su kontaktirali OpenAI s molbom za isprava u skladu s Općom uredbom o zaštiti podataka, člankom 16 Zakona o privatnosti koji nalaže pravo na ispravak pogrešnih osobnih podataka, tvrtka se ogradila tehničkim ograničenjem navodeći da sustav ne može izmijeniti podatke. Mogu samo filtrirati ili blokirati određene podatke kao odgovor na određene upite (poput imena podnositelja pritužbe), ali takvo rješenje spriječilo bi ChatGPT da filtrira bilo kakve informacije povezane s korisnikom. Noyb dodatno optužuje OpenAI da nije odgovorio na zahtjeve za informacije u skladu s GDPR-om. Naime, GDPR (članak 15.) daje pravo europskim građanima da vide koje podatke tvrtke posjeduju o njima.
Dvojica istraživača OpenAI-a otpuštena zbog curenja informacija: Što se događa u gigantu umjetne inteligencije?
OpenAI GPT-4: vodič za korištenje ili uvodne smjernice
OpenAI se bori protiv tužbi za autorska prava
Tko je u pravu?
OpenAI ne posjeduje bazu podataka koja sadrži sve podatke o svim ljudi. Ulazni podaci za obuku prikupljeni su iz niza izvora i uliveni u LLM jezični model. Također podaci na kojima LLM “oblikuje” svoj tekst su zbirka odnosa između kojih se slova najčešće pojavljuju u zbirci veza (riječi) koje su opet konstruirane vezama između riječi u rečenici. To je također razlog zašto LLM može halucinirati, jer ne zna za stvarne podatke.
S druge strane budući da LLM obrađuje skupove podataka i to čini na temelju odnosa između obrade podataka, ne bi trebali biti izuzeti od GDPR-a. Zakon jasno navodi da se ne mogu pohranjivati osjetljivi podaci bez transparentnosti i mogućnosti praćenja zahtjeva za brisanje. Ostaje otvoreno pitanje je li možda OpenAI i privremeno pohranio podatke za obuku budućih modela. Makar privremeno. Utom slučaju moraju također biti u skladu sa zakonom o privremenoj pohrani i obradi osobnih podataka. Ako ih OpenAI nema, već dolaze s drugog mjesta, onda moraju jasno navesti izvor. Drugo rješenje je u slučaju da ako je odgovor na pitanje u suprotnosti s GDPR-om, LLM mora naznačiti da na njega ne može odgovoriti zbog GDPR-a.
Ako regulatori potvrde kršenje GDPR-a, OpenAI-ju prijete novčane kazne do 4 posto globalnog prihoda. Ova tužba bi mogla biti presedan i dovesti do promjena u načinu na koji ChatGPT obrađuje podatke građana EU-a.
