Što je Deepfake? Kako ljudi stvaraju Deepfakes?

·

Što je Deepfake (1)

Deepfake je nova komunikacijska tehnologija u kojoj osoba jednostavno uzima dostupni tekst, slike, videozapise ili audio zapise, a zatim ih uređuje, odnosno ‘lažira’ ih kako bi izgledali poput drugih koristeći naprednu tehnologiju umjetne inteligencije (AI) i neuronske mreže (NN). Želite li uvrijediti svoje neprijatelje? Ili zamijeniti filmske protagoniste sa svojim omiljenim holivudskim superzvijezdama? Ili se samo želite natjerati da plešete poput Michaela Jacksona? Onda su deepfakeovi upravo ono što vam treba!
Nakon što se prvi put pojavila prije nekoliko godina, deepfake tehnologija evoluirala je od bezopasne varalice tehnološkog stručnjaka do zlonamjernog klevetničkog oružja. U ovom ćemo članku vidjeti kako funkcionira deepfake tehnologija, koje oblike poprima i kako možemo otkriti ili razbiti deepfake. Deepfake sadržaj eksponencijalno raste. Nažalost, deepfake tehnologija je mnogo puta korištena za stjecanje političke prednosti, narušavanje imidža protivnika ili počinjenje financijske prijevare.

Pogledajmo sada tri glavne vrste deepfakeova i istražimo znanost o podacima koja im omogućuje rad. Također ćemo se usredotočiti na tehnologije otkrivanja deepfakea na kojima rade sigurnosni istraživači i savjetnici kako bi suzbili korištenje deepfakeova sa zlonamjernom namjerom.

Što je Deepfake (2)

Deepfake tekst

U ranim danima umjetne inteligencije (AI) i obrade prirodnog jezika (NLP) smatralo se da će stroju biti izazovno obavljati kreativnu aktivnost poput crtanja ili pisanja. Još 2021.; S robusnim jezičnim modelima i knjižnicama izgrađenim tijekom godina povećanim radom istraživača i stručnjaka za znanost o podacima, najcjenjenija proza generirana umjetnom inteligencijom sada se može napisati s ljudskom sažetošću i koherentnošću.

S bibliotekama i moćnim jezičnim modelima, softverski alati pokretani umjetnom inteligencijom sada mogu sastavljati prozu s ljudskom koherentnošću i sažetošću. Primjerice GPT-2 – najnovija generacija sustava za generiranje teksta koji je objavio laboratorij OpenAI iz Silicijske doline, impresionirala je i obične ljude i profesionalce u tom području svojom sposobnošću generiranja koherentnog teksta s najmanje upita. OpenAI-jevi inženjeri koristili su više od 8 milijuna ogoljenih tekstualnih dokumenata (metoda izvlačenja relevantnih podataka s web stranica) i kombinirali s milijardu parametara za modeliranje i treniranje GPT-2 AI. Bit deepfakeova i drugih sličnih tehnologija kao što je duboko učenje, koje koristi umjetne tehnologije, leži u softveru za obuku da razmišlja i prilagođava se koristeći prošle podatke dobivene putem skupova podataka. Koristeći GPT-2, jednostavno upišete naslov, a algoritam deepfake teksta generirat će izmišljenu vijest oko tog naslova. Ili mu samo dajte prvi redak pjesme i vratit će cijeli stih. Mnogi mediji koriste deepfake algoritme u kombinaciji s tehnologijom indeksiranja weba za stvaranje priča ili blogova koje je napisao sam softver. Istraživači iz Centra za borbu protiv terorizma, ekstremizma i protuterorizma (CTEC) na Institutu za međunarodne studije Middlebury upozoravaju da bi se alati poput GPT-2 mogli zloupotrijebiti za širenje nadmoći ili širenje ekstremističkih poruka ekstremističkih organizacija.

Deepfakes na društvenim mrežama

Uz pisanje priča ili blogova, deepfake tehnologija također se može iskoristiti za stvaranje lažnog online profila koji je običnim korisnicima teško razlikovati. Na primjer, novinarka Bloomberga po imenu Maisy Kinsley na društvenim mrežama kao što su LinkedIn i Twitter vjerojatno je deepfake. Njezina profilna slika izgleda čudno, vjerojatno računalno generirana. Ovaj je profil možda stvoren radi financijske dobiti, budući da se profil Maisy Kinsley više puta pokušao povezati s kratkim prodavačima dionica Tesle na društvenim mrežama. Short selleri su ljudi koji su pesimistični u pogledu tržišta dionica i idu kratko, odnosno prodaju dionice u uvjerenju da će cijena dionice pasti, a zatim kupuju dionice po nižoj cijeni, u biti ostvarujući veliku zaradu. Drugi profil pod nazivom Katie Jones, koji se navodno odnosi na rad u Centru za strateške i međunarodne studije, utvrđeno je da je deepfake stvoren sa zlonamjernom namjerom špijunaže.

Otkrivanje tekstualnih deepfakeova

Istraživači s Allen Instituta za umjetnu inteligenciju razvili su softverski alat pod nazivom Grover za otkrivanje agregiranog sadržaja koji pluta na mreži. Istraživači tvrde da ovaj softver može otkriti eseje napisane pomoću deepfakeova u 92% slučajeva. Grover radi na skupu testova sastavljenih iz Common Crawla, web repozitorija i alata za indeksiranje otvorenog koda. Slično tome, tim znanstvenika s Harvarda i MIT-IBM-ovog laboratorija Watson zajednički su dizajnirali Giant Language Model Test Room, web alat koji ima za cilj razlikovati je li uneseni tekst generiran umjetnom inteligencijom.

Što je Deepfake (3)

Deepfake videozapisi

Stvaranje lažnih fotografija i videozapisa glavno je oružje deepfakea. Ovo je najčešće korišteni oblik deepfakea. Budući da živimo u svijetu popularnih društvenih medija, gdje slike i videozapisi bacaju svjetlo na događaje i priče bolje od običnog teksta. Moderna umjetna inteligencija za generiranje videa sposobnija je, a možda i opasnija, od one na prirodnom jeziku. Tehnološka tvrtka Hyperconnect sa sjedištem u Seulu nedavno je razvila alat pod nazivom MarioNETte koji može stvoriti deepfake videozapise povijesnih ličnosti, slavnih osoba i političara. To se postiže reprodukcijom lica druge osobe, a zatim će se izraz lica te osobe preklopiti na ciljnu osobnost koja će se stvoriti deepfake.

Kako se proizvode Deepfake videozapisi?

Ova video prijevara koristi tehniku koja se naziva generativne protivničke mreže (GAN). GAN su dio grane strojnog učenja koja se naziva neuronske mreže. Te su mreže dizajnirane da oponašaju neuronske procese ljudskog mozga. Programeri mogu trenirati neuronske mreže da prepoznaju ili manipuliraju određenim zadatkom. U GAN-u koji se koristi za stvaranje deepfakeova, dvije neuronske mreže postavljaju se jedna uz drugu kako bi se proizveo stvarni izlaz. Svrha ovoga je osigurati da stvoreni deepfakeovi izgledaju što realističnije. Bit GAN-ova leži u natjecanju između dvije neuronske mreže. U GAN-u, krivotvoritelj slika i detektor laži neprestano pokušavaju nadmašiti jedni druge. Obje neuronske mreže treniraju se pomoću istog skupa podataka.

Prva mreža, nazvana generator, ima zadatak stvoriti lažnu sliku pomoću vektora šuma (popis slučajnih brojeva) koji izgledaju što realističnije. Druga mreža, poznata kao diskriminator, određuje realizam proizvedenih slika. Uspoređuje lažne slike koje generira generator s originalnim slikama u skupu podataka kako bi utvrdio koje su slike stvarne, a koje lažne. Na temelju tih rezultata, generator mijenja parametar kako bi proizveo sliku. Ovaj se ciklus nastavlja sve dok diskriminator ne uspije identificirati generiranu sliku kao lažnu, koja se zatim koristi u konačnom izlazu. Zbog toga deepfakeovi izgledaju tako čudno.

Forenzički stručnjaci diljem svijeta rade na pronalaženju metoda i alata za prepoznavanje deepfake videozapisa, jer postaju sve uvjerljiviji. Kako alati za strojno učenje postupno stječu popularnost, postalo je mnogo lakše stvoriti uvjerljive lažne videozapise za širenje propagande ili jednostavno uznemiravanje ciljanog pojedinca.

Ministarstvo obrane SAD-a (DARPA) objavilo je alat za otkrivanje deepfake pod nazivom Media Forensics. U početku je program razvijen za automatizaciju postojećih forenzičkih alata, ali s porastom deepfakeova koristili su umjetnu inteligenciju za borbu protiv deepfakeova vođenih umjetnom inteligencijom.

Što je Deepfake (4)

Pogledajmo kako to funkcionira

Rezultirajući videozapis generiran deepfakeovima tehnički se značajno razlikuje u načinu na koji se isporučuju metapodaci videozapisa u usporedbi s izvornim metapodacima. Te su razlike poznate kao bljeskovi u matrici, što je ono što DARPA-in alat za otkrivanje deepfakea pokušava iskoristiti prilikom otkrivanja deepfake medija. Siwei Lyu, profesor računalnih znanosti na Državnom sveučilištu u New Yorku, primijetio je da lica stvorena pomoću deepfake tehnologije rijetko trepću. Čak izgledaju i neprirodno. To je pripisao činjenici da je većina videozapisa koji koriste deepfakeove obučena na statičnim slikama. Međutim, fotografije osobe obično se snimaju kada su joj oči otvorene. Osim treptanja, druge podatkovne točke o pokretima lica, kao što su kada se smiješe gornjoj usni tijekom razgovora, kako odmahuju glavom itd., također mogu pružiti naznake o tome je li video koji se emitira lažan ili ne.

Deepfake zvuk

Snaga umjetne inteligencije i neuronskih mreža nije ograničena na tekst, slike i videozapise. Oni mogu lako kopirati glas osobe. Sve što je potrebno je skup podataka glasovnih snimaka osobe čiji glas treba simulirati. Deepfake algoritmi će učiti iz tog skupa podataka i biti osnaženi za reprodukciju intonacije glasa ciljane osobe.

Komercijalni softver stiže na tržište poput Lyrebirda i Deep Voicea, u kojima trebate reći samo nekoliko rečenica prije nego što se AI navikne na vaš glas i intonaciju. Kada dodate vlastiti glas, ovaj softver postaje dovoljno moćan da kopira vaš glas. Nakon što unesete vlastiti skup podataka audio uzoraka, samo trebate smisliti rečenicu ili odlomak, a ovaj deepfake softver će pročitati tekst vašim glasom!

Audio Detection Trenutno nema mnogo namjenskih deepfake audio alata, ali programeri i tvrtke za kibernetičku sigurnost naporno rade na pronalasku boljih rješenja za zaštitu u tom pogledu. Na primjer, prošle su godine programeri u tehnološkom startupu Resemble razvili alat otvorenog koda pod nazivom Resemblyzer za otkrivanje deepfake audio isječaka. Resemblyzer koristi napredne algoritme strojnog učenja kako bi došao do računalnih prikaza uzoraka glasa kako bi predvidio jesu li stvarni ili lažni. Kad god korisnik pošalje audio datoteku na procjenu, generira matematički prikaz koji sažima jedinstvene karakteristike poslanog uzorka glasa. Kroz ovaj proces pretvorbe, stroj može otkriti je li glas stvaran ili umjetno generiran deepfake alatima.

Istraga koju su prošle godine proveli laboratoriji Deeptrace otkrila je da na internetu vreba više od 14.000 deepfake videa. Također su zabilježili povećanje proizvodnje od 84% u samo sedam mjeseci. Zanimljivo je da je više od 90% deepfake videa pornografski, u kojima poznate žene mogu zamijeniti lica.

Kada deepfakeovi dobivaju ozbiljnu pozornost, to predstavlja ozbiljan problem koji ne samo da narušava privatnost, već i narušava dostojanstvo pojedinca. Ironično, u borbi protiv deepfakeova pokretanih umjetnom inteligencijom koristi se umjetna inteligencija. Iako ‘dobra’ umjetna inteligencija pomaže u prepoznavanju deepfakeova, ovaj sustav otkrivanja uvelike se oslanja na skup podataka koji koristi za obuku. To znači da mogu dobro funkcionirati za otkrivanje deepfake videozapisa slavnih osoba, jer je o njima dostupna velika količina podataka. Ali otkrivanje deepfakea od strane osobe niskog profila bit će izazov za takve sustave otkrivanja.

Tehnološke tvrtke društvenih medija također rade na sustavima za otkrivanje deepfakea. Facebook je nedavno objavio da radi na automatiziranom sustavu za prepoznavanje deepfake sadržaja na svojoj platformi i njegovo uklanjanje. Isto tako, Twitter predlaže označavanje deepfakeova i njihovo uklanjanje ako se utvrdi da su provokativni. Iako prepoznajemo i cijenimo napore ovih tehnoloških tvrtki, samo će vrijeme pokazati koliko su uspješne u zaustavljanju zlonamjernih deepfake videozapisa!