Doživite DeepSeek R1 destilirane ‘Reasoning’ modele na AMD Ryzen AI procesorima i Radeon GPU-ima
DeepSeek R1 je nedavno objavljen granični “reasoning” model koji je destiliran u vrlo sposobne manje modele. Implementacija ovih DeepSeek R1 destiliranih modela na AMD Ryzen AI procesore i Radeon grafičke kartice nevjerojatno je jednostavna i dostupna je sada putem LM Studija.
AMD je objavio post na blogu koji detaljno opisuje kako pokrenuti modele DeepSeek R1 Distilled Reasoning na AMD Ryzen AI procesorima i Radeon grafičkim karticama. Modeli rasuđivanja nova su klasa velikih jezičnih modela (LLM-ova) dizajniranih za rješavanje vrlo složenih zadataka korištenjem rasuđivanja lanca mišljenja (CoT).
Modeli rasuđivanja dodaju fazu “razmišljanja” prije konačnog rezultata – što možete vidjeti proširenjem prozora “razmišljanja” prije nego što model da svoj konačni odgovor. Za razliku od konvencionalnih LLM-ova, koji daju jednokratni odgovor, CoT LLM-i izvode opsežno obrazloženje prije odgovora.
Model rezoniranja može prvo potrošiti tisuće tokena (i možete vidjeti ovaj lanac misli!) da analizira problem prije nego što da konačni odgovor. To omogućuje modelu da bude izvrstan u složenim zadacima rješavanja problema koji uključuju matematiku i znanost te da napadne složeni problem iz svih kutova prije nego što odluči o odgovoru. Ovisno o vašem AMD hardveru, svaki od ovih modela nudit će najsuvremenije mogućnosti zaključivanja na vašem AMD Ryzen AI procesoru ili Radeon grafičkim karticama

