Wikipedia traži od AI tvrtki plaćanje kako bi izbjegla financijske probleme zbog scraping-a

Suosnivač Wikipedije, Jimmy Wales, izjavio je da enciklopedija surađuje s velikim tehnološkim tvrtkama na licenciranju sadržaja za AI obuku, slično dogovoru s Googleom, kako bi pokrili povećane troškove povezane s automatskim preuzimanjem podataka (scrapingom).

Wales je objasnio da korištenje sadržaja Wikipedije za treniranje velikih jezičnih modela povećava troškove infrastrukture – potreban je veći broj servera, više RAM-a i memorije za keširanje – što neprofitnu organizaciju stavlja pod pritisak. Sadržaj Wikipedije i dalje ostaje slobodan za pojedince, ali komercijalni automatizirani pristup zahtijeva poseban dogovor. Podsjetio je na sporazum iz 2022. s Alphabetom (Google), koji plaća pristup sadržaju za treniranje AI modela, te naveo da pregovori traju i s drugim tvrtkama. Naglasio je da male donacije javnosti, glavni izvor prihoda Wikimedia Foundation, nisu namijenjene financiranju milijardnih AI projekata. „Ljudi doniraju za podršku Wikipediji, a ne za subvencioniranje OpenAI-ja,“ rekao je.

Kako bi zaštitila svoje resurse, Wikipedia razmatra i tehnička rješenja poput kontrole pristupa AI botovima putem Cloudflarea, što bi omogućilo ograničavanje automatskog preuzimanja podataka. Ranije je Wikipedia objavila i skupove podataka za treniranje AI-a, kako bi smanjila opterećenje svojih servera prilikom scraping-a.

DRUGE NOVOSTI

Gamescom 2026 rasprodan mjesec dana prije početka – sav izložbeni prostor popunjen, stižu nova velika imena i premijere

NVIDIA i SEGA slave 30 godina inovacija, donoseći VIRTUA FIGHTER CROSSROADS na RTX Spark

Gears of War: E-Day izlazi 6. listopada s DLSS 4.5 i Ray Tracingom

Microsoft će implementirati procesore AMD Instinct i AMD EPYC sljedeće generacije u sklopu proširenja dugoročnog strateškog partnerstva dviju tvrtki