Anthropic, poznata po AI modelu Claude, uništio milijune knjiga kako bi trenirali umjetnu inteligenciju
Otkriće da je tvrtka Anthropic, poznata po AI modelu Claude, uništila milijune knjiga kako bi trenirala umjetnu inteligenciju, izazvalo je snažnu etičku i kulturnu raspravu. Iako je pravno sve bilo “čisto”, mnogima je ovaj potez upalio alarm: je li brzina razvoja umjetne inteligencije došla po cijenu naše kulturne baštine?
Što se zapravo dogodilo?
Anthropic je kupovao rabljene papirnate knjige na veliko – legalno. Te su knjige fizički uništene (izrezane, bez korica, skenirane, pa odbačene). Knjige su skenirane u PDF datoteke sa strojno čitljivim tekstom, i te su datoteke korištene za obuku AI modela. Cilj ne bio izbjeći komplikacije s licencama i dobiti kvalitetan jezični materijal za treniranje.
Je li to legalno? Da.
Sudac William Alsup presudio je da je ova praksa dozvoljena prema doktrini “poštene upotrebe”, jer:
- Anthropic je kupio knjige legalno
- Sadržaj je korišten interno (nije distribuiran)
- Proces je bio transformativan – knjige su konvertirane u novi format, a originali uništeni.
No, zakonitost ne znači automatski i etičnost.
Integracija Anthropic Claudea s Google Workspaceom ubrzala je povijesti razgovora i ubrzala produktivnost
Google krade Anthropicovog Claudea kako bi trenirao vlastitu umjetnu inteligenciju Gemini?
Anthropic Claude 3.5 Sonnet – najsigurniji Jezični model
Zašto su uništavali knjige?
Razlog je vrlo pragmatičan: brzina + trošak + pravna sigurnost.
- Destruktivno skeniranje je jeftinije i brže od nježnih, arhivskih metoda
- Kupnja fizičkih primjeraka izbjegava pregovore s izdavačima i pravne neizvjesnosti oko e-knjiga
- Visokokvalitetne knjige s lekturom i uredništvom idealne su za treniranje AI – bolje nego npr. postovi na forumima
Zašto je ovo problematično?
- Kulturni gubitak: Čak i ako su to bile rabljene knjige, fizička kopija je zauvijek izgubljena
- Etika industrije: AI se razvija na temeljima ljudskog znanja – ali je li pošteno “pojesti” to znanje bez očuvanja izvora?
- Alternative postoje: Internet Archive koriste nedestruktivne metode, a OpenAI i Microsoft rade s Harvardom na digitalizaciji knjiga koje se fizički čuvaju.
Ključno pitanje: Treba li razvoj AI biti destruktivan?
AI industrija se natječe u brzini i količini podataka, ali po cijenu:
- uništavanja stvarnih, opipljivih artefakata znanja
- etičkih kompromisa u odnosu prema autorima i izdavačima
- gubitka povjerenja javnosti u tehnologiju
Anthropicov slučaj otkriva tamniju stranu AI utrke: žrtve napretka nisu samo radna mjesta i privatnost – već i same knjige, a ako AI želimo graditi kao nastavak ljudske mudrosti, onda bi i način na koji se trenira trebao poštovati tu mudrost, a ne je samljeti radi brzine.

