Koje algoritme umjetne inteligencije otvorenog koda može podnijeti vaša grafička kartica? Ovaj besplatni web alat pomoći će vam da izračunate u sekundama!

·

ai_gpu_naslovnica1

Iako sada postoji sve više i više AI modela otvorenog koda, oni također postaju sve hardverski zahtjevniji. Međutim, običnim ljudima je teško shvatiti “Je li moje računalo dovoljno snažno?” Nedavno je pokrenut besplatni web alat koji može brzo utvrditi može li računalo pokrenuti određeni AI model na temelju kapaciteta VRAM-a. Čak podržava i RTX 3060 i Apple M seriju čipova.

ai_gpu_kalkulator slika_1 ai_gpu_kalkulator slika_2

Ovaj web alat, nazvan LLM Inference: VRAM & Performance Calculator”, ima za cilj “pomoći vam da shvatite može li vaše računalo pokrenuti određeni LLM”.

Nevjerojatno je jednostavan za korištenje:

  • Odaberite model umjetne inteligencije koji želite pokrenuti (kao što je DeepSeek-R1, Llama 3 itd.)
  • Odaberite GPU ili Apple Silicon uređaj koji se koristi u vašem računalu

Sustav će automatski prikazati VRAM potreban za model, dostupan VRAM vaše grafičke kartice i može li se pokrenuti

Na primjer, prema zadanim postavkama, odabran je model DeepSeek-R1 3B i uparen s RTX 3060 (12 GB). Rezultati pokazuju da je stopa iskorištenosti VRAM-a 66,8%, što može funkcionirati glatko.

ai_gpu_kalkulator slika_3 ai_gpu_kalkulator slika_4

Je li model prevelik za obradu? Možete koristiti više grafičkih procesora za paralelno izvršavanje izračuna.

Alat također podržava paralelno simulacijsko testiranje s više GPU-ova. Na primjer, vrlo veliki model poput LLaMA 3 70B ne može se pokrenuti na jednom H100 (80GB) GPU-u, ali ako odaberete “3 H100 paralelno”, sustav će naznačiti da je to podržano. Ovo je vrlo korisno za one koji planiraju izgraditi AI servere, a može poslužiti i kao referenca za planiranje nadogradnje opreme.

Na dnu zaslona nalazi se i značajka “Simulacija brzine zaključivanja” koja koristi animaciju za prikaz brzine generiranja teksta AI modela. Iako ovo nije stvarno izvršenje, može vam pomoći da shvatite razlike u performansama, poput toga koliko je brže generiranje teksta na različitim GPU-ima ili modelima.

Alat je potpuno besplatan za korištenje i ne zahtijeva registraciju ili prijavu.