Ukratko: AI ne može prepoznati vlastite deepfakeove

·

Ukratko_ AI ne može prepoznati vlastite deepfakeove

Vodeći AI chatbotovi nisu uspjeli utvrditi jesu li videozapisi koje su im učitani kreirali OpenAI-jev Sora generator, čak ni OpenAI-jev vlastiti ChatGPT nije uspio prepoznati sadržaj kao AI-generiran, a odgovarajuća testiranja proveli su stručnjaci NewsGuarda.

OpenAI-jev Sora video generator brzo je stekao reputaciju da ljude može prevariti da povjeruju kako su AI-generirani videozapisi stvarni, a može prevariti i druge AI servise, jer Sorine videozapise s vodenim žigom nisu otkrili xAI Grok, koji je dao netočan odgovor u 95 posto slučajeva, OpenAI ChatGPT, koji je pogriješio u 92,5 posto slučajeva, i Google Gemini, koji je pogriješio u 78 posto slučajeva.

Iako je prisutnost vodenih žigova poboljšala pokazatelje, čak i tada Grok nije prepoznao videozapise u 30 posto slučajeva, a ChatGPT u 7,5 posto slučajeva, što pokazuje da vodeni žigovi nisu jamstvo točnosti, dok su ChatGPT i Gemini često ukazivali na vodeni žig kao dokaz lažiranja i uočili dodatne znakove AI generiranja, uključujući iskrivljenja i neprirodno osvjetljenje.

ChatGPT i Gemini nisu reagirali na AI-generirani video tinejdžera kojeg pritvara imigracijska služba, već su tvrdili da se mjesto događaja poklapa s izvorima vijesti ili ga potvrđuju, a incident se u stvarnosti nije dogodio, što pokazuje da AI može halucinirati kontekst i potvrđivati lažne informacije.

Google Gemini je jedini chatbot testiran za koji je programer postavio funkciju detekcije AI sadržaja koji stvara Nano Banana Pro model iste tvrtke, a chatbot se dobro nosio s tim videozapisima jer je čak i bez vodenih žigova dao točan odgovor u pet od pet slučajeva, što sugerira da AI modeli mogu pouzdano prepoznati samo sadržaj iz vlastitog ekosustava.

Autori studije nisu testirali sposobnost Groka i ChatGPT-a da prepoznaju vlastiti sadržaj, a xAI i OpenAI nisu objavili mogućnost detekcije vlastitog generiranog sadržaja, dok AI servisi općenito ne žele priznati svoje netočne odgovore, što su potvrdili NewsGuardovi testovi jer su ChatGPT, Gemini i Grok u 2,5, 10 i 13 posto slučajeva izjavili da ne mogu provesti analizu, ali češće su pogriješili tako što su AI-generirane videozapise proglasili autentičnima.

OpenAI je službeno potvrdio da ChatGPT nema način razlikovati AI-generirane videozapise od stvarnih, što znači da ne postoji skriveni detektor niti pouzdana automatska verifikacija, a sve se svodi na pretpostavke i heuristiku. Ovo istraživanje pokazuje da AI postaje bolji u stvaranju iluzije stvarnosti nego u njezinu prepoznavanju, da vodeni žigovi nisu dovoljni za pouzdanu detekciju i da automatizirana provjera autentičnosti videozapisa još nije spremna, pa odgovornost za prepoznavanje stvarnog i lažnog sadržaja ostaje ljudima, novinarima i stručnjacima za forenzičku analizu.