VASA-1: AI model koji generira videozapise iz slike i zvuka budi kontroverze

Generativne tehnologije i aplikacije umjetne inteligencije (GenAI) doživljavaju nagli rast, a Microsoftov nedavno predstavljeni AI model “VASA-1” podiže nam obrve svojom sposobnošću generiranja videozapisa iz samo jedne slike i jedne audio snimke. Osim što je tehnološki impresivan, VASA-1 je ponovno pokrenuo raspravu o potencijalnim rizicima i zloupotrebi AI-a.

Kako VASA-1 funkcionira?

Prema Microsoftovoj web stranici, VASA1 može automatski generirati fotorealističan video osobe s slike koja “govori” s realističnim pokretima usta, izrazima lica i glave. Korisnici mogu učiniti da lica gledaju u određenim smjerovima, povećavati ih ili smanjivati i prenositi različite emocije. Ovaj AI generira videookvire veličine 512×512 piksela pri 45 sličica u sekundi u izvanmrežnom načinu skupne obrade. Također, može podržavati do 40 fps u mrežnom načinu streaminga.

Microsoft just dropped VASA-1.

This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba

10 wild examples:

1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD

— Min Choi (@minchoi) April 18, 2024

U demo videozapisima, model kontrolira različite emocije i mijenja smjer pogleda. U jednom zabavnom primjeru, “Mona Lisa” pjeva rap pjesmu “Paparazzi” Anne Hathaway.

Zabrinutost zbog lažnih videozapisa

Sposobnost generiranja uvjerljivih lažnih videozapisa VASA-1, izazvala je zabrinutost zbog potencijalnog širenja dezinformacija. Microsoft je u svom odgovoru naglasio da je tehnologija dizajnirana za dobrobit čovječanstva i da bi se mogla koristiti u obrazovanju ili pružanju virtualnih pratitelja. Međutim, istakli su da se VASA-1 trenutno koristi samo za istraživanje i da “neće biti objavljeni demo snimci, API-ji ili proizvodi s VASA-1 osim ako nisu sigurni da će se tehnologija koristiti odgovorno.”

Važnost odgovornog korištenja AI-a

VASA-1 je primjer moći i potencijalnih opasnosti AI-a. Dok ova tehnologija ima potencijal da se koristi u mnoge pozitivne svrhe, neophodno je da se razvija i koristi odgovorno. Microsoft je pokazao svjesnost o ovim rizicima i poduzima korake kako bi osigurali da se VASA-1 ne koristi za širenje dezinformacija ili nanošenje štete. Važno je da i ostale tvrtke i istraživači u području AI-a slijede ovaj primjer i da se fokusiraju na etički i odgovoran razvoj i korištenje ovih moćnih tehnologija.

Kako VASA-1 funkcionira?

Zabrinutost zbog lažnih videozapisa

Važnost odgovornog korištenja AI-a

DRUGE NOVOSTI

Predsjednik ADATA-e upozorava: Globalna nestašica RAM-a mogla bi potrajati sljedećih deset godina

Arhitektura NVIDIA Vera: Kako je prilagođeni Arm CPU dizajniran za eru agentske umjetne inteligencije

NVIDIA otkrila kako DLSS 5 funkcionira: programeri dobivaju veću kontrolu nad AI renderiranjem igara

Giga Computing ubrzava umjetnu inteligenciju za poduzeća velikih razmjera s AMD EPYC™ serverskim procesorima 6. generacije