Anthropic, poznata po AI modelu Claude, uništio milijune knjiga kako bi trenirali umjetnu inteligenciju

Otkriće da je tvrtka Anthropic, poznata po AI modelu Claude, uništila milijune knjiga kako bi trenirala umjetnu inteligenciju, izazvalo je snažnu etičku i kulturnu raspravu. Iako je pravno sve bilo “čisto”, mnogima je ovaj potez upalio alarm: je li brzina razvoja umjetne inteligencije došla po cijenu naše kulturne baštine?

Što se zapravo dogodilo?

Anthropic je kupovao rabljene papirnate knjige na veliko – legalno. Te su knjige fizički uništene (izrezane, bez korica, skenirane, pa odbačene). Knjige su skenirane u PDF datoteke sa strojno čitljivim tekstom, i te su datoteke korištene za obuku AI modela. Cilj ne bio izbjeći komplikacije s licencama i dobiti kvalitetan jezični materijal za treniranje.

Je li to legalno? Da.

Sudac William Alsup presudio je da je ova praksa dozvoljena prema doktrini “poštene upotrebe”, jer:

Anthropic je kupio knjige legalno
Sadržaj je korišten interno (nije distribuiran)
Proces je bio transformativan – knjige su konvertirane u novi format, a originali uništeni.

No, zakonitost ne znači automatski i etičnost.

Integracija Anthropic Claudea s Google Workspaceom ubrzala je povijesti razgovora i ubrzala produktivnost

Google krade Anthropicovog Claudea kako bi trenirao vlastitu umjetnu inteligenciju Gemini?

Anthropic Claude 3.5 Sonnet – najsigurniji Jezični model

Zašto su uništavali knjige?

Razlog je vrlo pragmatičan: brzina + trošak + pravna sigurnost.

Destruktivno skeniranje je jeftinije i brže od nježnih, arhivskih metoda
Kupnja fizičkih primjeraka izbjegava pregovore s izdavačima i pravne neizvjesnosti oko e-knjiga
Visokokvalitetne knjige s lekturom i uredništvom idealne su za treniranje AI – bolje nego npr. postovi na forumima

Zašto je ovo problematično?

Kulturni gubitak: Čak i ako su to bile rabljene knjige, fizička kopija je zauvijek izgubljena
Etika industrije: AI se razvija na temeljima ljudskog znanja – ali je li pošteno “pojesti” to znanje bez očuvanja izvora?
Alternative postoje: Internet Archive koriste nedestruktivne metode, a OpenAI i Microsoft rade s Harvardom na digitalizaciji knjiga koje se fizički čuvaju.

Ključno pitanje: Treba li razvoj AI biti destruktivan?

AI industrija se natječe u brzini i količini podataka, ali po cijenu:

uništavanja stvarnih, opipljivih artefakata znanja
etičkih kompromisa u odnosu prema autorima i izdavačima
gubitka povjerenja javnosti u tehnologiju

Anthropicov slučaj otkriva tamniju stranu AI utrke: žrtve napretka nisu samo radna mjesta i privatnost – već i same knjige, a ako AI želimo graditi kao nastavak ljudske mudrosti, onda bi i način na koji se trenira trebao poštovati tu mudrost, a ne je samljeti radi brzine.

Što se zapravo dogodilo?

Integracija Anthropic Claudea s Google Workspaceom ubrzala je povijesti razgovora i ubrzala produktivnost

Google krade Anthropicovog Claudea kako bi trenirao vlastitu umjetnu inteligenciju Gemini?

Anthropic Claude 3.5 Sonnet – najsigurniji Jezični model

Zašto su uništavali knjige?

Ključno pitanje: Treba li razvoj AI biti destruktivan?

DRUGE NOVOSTI

Sretan rođendan Godeal24! Nabavite doživotnu licencu Officea 2021 Pro i Windowsa 11 Pro za samo 12 €!

Snapdragon 8 Gen 5 vs Dimensity 9400 Plus: Qualcomm vodi u CPU-u, MediaTek uzvraća GPU snagom

Samsung želi donijeti AI memoriju iz servera u pametne telefone

ASUS prvi put lansirao vlastiti ROG RAM: DDR5 memorija ide do 8800 MT/s