Wikipedia traži od AI tvrtki plaćanje kako bi izbjegla financijske probleme zbog scraping-a
Suosnivač Wikipedije, Jimmy Wales, izjavio je da enciklopedija surađuje s velikim tehnološkim tvrtkama na licenciranju sadržaja za AI obuku, slično dogovoru s Googleom, kako bi pokrili povećane troškove povezane s automatskim preuzimanjem podataka (scrapingom).
Wales je objasnio da korištenje sadržaja Wikipedije za treniranje velikih jezičnih modela povećava troškove infrastrukture – potreban je veći broj servera, više RAM-a i memorije za keširanje – što neprofitnu organizaciju stavlja pod pritisak. Sadržaj Wikipedije i dalje ostaje slobodan za pojedince, ali komercijalni automatizirani pristup zahtijeva poseban dogovor. Podsjetio je na sporazum iz 2022. s Alphabetom (Google), koji plaća pristup sadržaju za treniranje AI modela, te naveo da pregovori traju i s drugim tvrtkama. Naglasio je da male donacije javnosti, glavni izvor prihoda Wikimedia Foundation, nisu namijenjene financiranju milijardnih AI projekata. „Ljudi doniraju za podršku Wikipediji, a ne za subvencioniranje OpenAI-ja,“ rekao je.
Kako bi zaštitila svoje resurse, Wikipedia razmatra i tehnička rješenja poput kontrole pristupa AI botovima putem Cloudflarea, što bi omogućilo ograničavanje automatskog preuzimanja podataka. Ranije je Wikipedia objavila i skupove podataka za treniranje AI-a, kako bi smanjila opterećenje svojih servera prilikom scraping-a.
