Anthropic, poznata po AI modelu Claude, uništio milijune knjiga kako bi trenirali umjetnu inteligenciju

·

Anthropic, poznata po AI modelu Claude, uništio milijune knjiga kako bi trenirali umjetnu inteligenciju_1

Otkriće da je tvrtka Anthropic, poznata po AI modelu Claude, uništila milijune knjiga kako bi trenirala umjetnu inteligenciju, izazvalo je snažnu etičku i kulturnu raspravu. Iako je pravno sve bilo “čisto”, mnogima je ovaj potez upalio alarm: je li brzina razvoja umjetne inteligencije došla po cijenu naše kulturne baštine?

Što se zapravo dogodilo?

Anthropic je kupovao rabljene papirnate knjige na veliko – legalno. Te su knjige fizički uništene (izrezane, bez korica, skenirane, pa odbačene). Knjige su skenirane u PDF datoteke sa strojno čitljivim tekstom, i te su datoteke korištene za obuku AI modela. Cilj ne bio izbjeći komplikacije s licencama i dobiti kvalitetan jezični materijal za treniranje.

Je li to legalno? Da. 

Sudac William Alsup presudio je da je ova praksa dozvoljena prema doktrini “poštene upotrebe”, jer:

  • Anthropic je kupio knjige legalno
  • Sadržaj je korišten interno (nije distribuiran)
  • Proces je bio transformativan – knjige su konvertirane u novi format, a originali uništeni.

No, zakonitost ne znači automatski i etičnost.

Integracija Anthropic Claudea s Google Workspaceom ubrzala je povijesti razgovora i ubrzala produktivnost

Google krade Anthropicovog Claudea kako bi trenirao vlastitu umjetnu inteligenciju Gemini?

Anthropic Claude 3.5 Sonnet – najsigurniji Jezični model

Anthropic, poznata po AI modelu Claude, uništio milijune knjiga kako bi trenirali umjetnu inteligenciju

Zašto su uništavali knjige?

Razlog je vrlo pragmatičan: brzina + trošak + pravna sigurnost.

  • Destruktivno skeniranje je jeftinije i brže od nježnih, arhivskih metoda
  • Kupnja fizičkih primjeraka izbjegava pregovore s izdavačima i pravne neizvjesnosti oko e-knjiga
  • Visokokvalitetne knjige s lekturom i uredništvom idealne su za treniranje AI – bolje nego npr. postovi na forumima

Zašto je ovo problematično?

  • Kulturni gubitak: Čak i ako su to bile rabljene knjige, fizička kopija je zauvijek izgubljena
  • Etika industrije: AI se razvija na temeljima ljudskog znanja – ali je li pošteno “pojesti” to znanje bez očuvanja izvora?
  • Alternative postoje:  Internet Archive koriste nedestruktivne metode, a  OpenAI i Microsoft rade s Harvardom na digitalizaciji knjiga koje se fizički čuvaju.

Ključno pitanje: Treba li razvoj AI biti destruktivan?

AI industrija se natječe u brzini i količini podataka, ali po cijenu:

  • uništavanja stvarnih, opipljivih artefakata znanja
  • etičkih kompromisa u odnosu prema autorima i izdavačima
  • gubitka povjerenja javnosti u tehnologiju

Anthropicov slučaj otkriva tamniju stranu AI utrke: žrtve napretka nisu samo radna mjesta i privatnost – već i same knjige, a ako AI želimo graditi kao nastavak ljudske mudrosti, onda bi i način na koji se trenira trebao poštovati tu mudrost, a ne je samljeti radi brzine.