OpenAI trenirao svoj AI model snimanjem video sadržaja s YouTubea – i to je navodno poštena upotreba

·

OpenAI trenirao svoj AI model  snimanjem video sadržaja s YouTubea

Izvršni direktor YouTubea Neal Mohan rekao je u intervjuu za Bloomberg News da je OpenAI obučio model umjetne inteligencije iza svog tekstualno generiranog video alata Sora putem YouTube videozapisa, što je očito kršenje pravila o upotrebi, odnosno neovlaštenog preuzimanja sadržaja. Ali Google ih nije zaustavio. Hoće li se sada otvoriti nova pravna fronta za OpenAI? Čini se da ipak neće. Razlog je povezan s činjenicom da i sam Google trenira svoj AI model s YouTube video sadržajem. I tu Google ne vidi ništa sporno ili protuzakonito na svojoj strani.

Naglašavaju da koriste samo kreativni video sadržaj onih koji su pristali sudjelovati u eksperimentalnom programu za obuku. Prije toga već su prilagodili svoja pravila o privatnosti u srpnju 2023. godine kako bi im bilo prikladnije prikupljanje javno dostupnih informacija za obuku modela umjetne inteligencije koje su korisnici prenijeli na platformu.

Sora, OpenAI model trebao bi biti dostupan ove godine

Musk tuži OpenAI: borba za otvorenu umjetnu inteligenciju

OpenAI trenirao svoj AI model  snimanjem video sadržaja s YouTubea_1

I opet se vraćamo na temu obuke AI modela faraonskim količinama visokokvalitetnih podataka i autorskim pravima

Vodeće tvrtke za umjetnu inteligenciju imaju omiljenu frazu kada je u pitanju opisivanje odakle im podaci za obuku modela: Kažu da su “javno dostupni” na internetu. Ovom frazom potvrđuju da treniraju s točnim licenciranim podacima ili koriste podatke iz javne domene koje svatko može koristiti bez zaštite.

Timothy K. Giordano, pravni savjetnik koji je radio na tužbama protiv nekoliko tvrtki za razvoj umjetne inteligencije, komentirao je da je izraz “javno dostupni podaci” neprihvatljiv. Mnogi od tih podataka već su zaštićeni autorskim pravima. Uz to, pojam uključuje i dohvaćanje podataka s piratskih webova, što je čak i protuzakonito. Također nastavlja objašnjenje da velike tvrtke za razvoj umjetne inteligencije poput OpenAI govore da koriste licencirane podatke u kombinaciji s javno dostupnim informacijama na Internetu. Drugi tehnološki div, Microsoft, kaže kako koristi podatke iz više izvora, uključujući javno dostupne na internetu, kako bi udovoljio autorskim i pravnim zahtjevima.

Sve proizlazi iz prošle tužbe koju su izdavači podnijeli protiv Google Booksa, a koja je završila sudskom presudom da je upotreba “nekih” javno dostupnih podataka zaštićenih autorskim pravima “poštena upotreba”.