VASA-1: AI model koji generira videozapise iz slike i zvuka budi kontroverze
Generativne tehnologije i aplikacije umjetne inteligencije (GenAI) doživljavaju nagli rast, a Microsoftov nedavno predstavljeni AI model “VASA-1” podiže nam obrve svojom sposobnošću generiranja videozapisa iz samo jedne slike i jedne audio snimke. Osim što je tehnološki impresivan, VASA-1 je ponovno pokrenuo raspravu o potencijalnim rizicima i zloupotrebi AI-a.
Kako VASA-1 funkcionira?
Prema Microsoftovoj web stranici, VASA1 može automatski generirati fotorealističan video osobe s slike koja “govori” s realističnim pokretima usta, izrazima lica i glave. Korisnici mogu učiniti da lica gledaju u određenim smjerovima, povećavati ih ili smanjivati i prenositi različite emocije. Ovaj AI generira videookvire veličine 512×512 piksela pri 45 sličica u sekundi u izvanmrežnom načinu skupne obrade. Također, može podržavati do 40 fps u mrežnom načinu streaminga.
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024
U demo videozapisima, model kontrolira različite emocije i mijenja smjer pogleda. U jednom zabavnom primjeru, “Mona Lisa” pjeva rap pjesmu “Paparazzi” Anne Hathaway.
Zabrinutost zbog lažnih videozapisa
Sposobnost generiranja uvjerljivih lažnih videozapisa VASA-1, izazvala je zabrinutost zbog potencijalnog širenja dezinformacija. Microsoft je u svom odgovoru naglasio da je tehnologija dizajnirana za dobrobit čovječanstva i da bi se mogla koristiti u obrazovanju ili pružanju virtualnih pratitelja. Međutim, istakli su da se VASA-1 trenutno koristi samo za istraživanje i da “neće biti objavljeni demo snimci, API-ji ili proizvodi s VASA-1 osim ako nisu sigurni da će se tehnologija koristiti odgovorno.”
Važnost odgovornog korištenja AI-a
VASA-1 je primjer moći i potencijalnih opasnosti AI-a. Dok ova tehnologija ima potencijal da se koristi u mnoge pozitivne svrhe, neophodno je da se razvija i koristi odgovorno. Microsoft je pokazao svjesnost o ovim rizicima i poduzima korake kako bi osigurali da se VASA-1 ne koristi za širenje dezinformacija ili nanošenje štete. Važno je da i ostale tvrtke i istraživači u području AI-a slijede ovaj primjer i da se fokusiraju na etički i odgovoran razvoj i korištenje ovih moćnih tehnologija.
