Što su veliki jezični modeli ili LLM?
Objavljeno prije 2 sata - Sanja Ledinek
Što su veliki jezični modeli ili LLM?
Što je LLM?
Veliki jezični modeli (LLM) su klasa temeljnih modela koji su obučeni na velikim količinama podataka kako bi pružili temeljne mogućnosti potrebne za pokretanje višestrukih slučajeva upotrebe i aplikacija te rješavanje velikog broja zadataka, To je u oštroj suprotnosti s idejom izgradnje i obuke modela specifičnih za domenu pojedinačno za svaki slučaj upotrebe, što je preveliko prema mnogim kriterijima (najvažnije troškovima i infrastrukturi), inhibira sinergije, a može čak dovesti i do pogoršanja performansi.
LLM-ovi su poznato ime zahvaljujući ulozi koju igraju u dovođenju generativne umjetne inteligencije u prvi plan javnog interesa, kao i fokusu organizacije na usvajanje umjetne inteligencije u brojnim poslovnim funkcijama i slučajevima upotrebe. S novim razvojem generativne umjetne inteligencije, čini se da se veliki jezični modeli (LLM) pojavljuju izvan poslovnog okruženja. Međutim, mnoge tvrtke,već godinama implementiraju LLM-ove na različitim razinama kako bi poboljšale mogućnosti razumijevanja prirodnog jezika (NLU) i obrade prirodnog jezika (NLP). To se događa u tandemu s napretkom u strojnom učenju, modelima strojnog učenja, algoritmima, neuronskim mrežama i modelima transformatora koji pružaju arhitekturu za AI sustave.
LLM-ovi predstavljaju veliki napredak u NLP-u i umjetnoj inteligenciji, a lako su dostupni javnosti putem sučelja kao što su Open AI-jev Chat GPT-3 i GPT-4, koje podržava Microsoft. Ostali primjeri uključuju Metin model Llama i Googleove dvosmjerne reprezentacije kodera iz modela Transformer (BERT/RoBERTa) i PaLM. IBM je također nedavno lansirao obitelj modela Granite na watsonx.ai, koja je postala generativna AI okosnica drugih IBM-ovih proizvoda kao što su watsonx Assistant i watsonx Orchestrate.
Ukratko, LLM-ovi su dizajnirani da se obučavaju na velikim količinama podataka za razumijevanje i generiranje teksta, kao i drugih oblika sadržaja, poput ljudi. Ovaj model ima sposobnost ekstrapolacije iz okoline, generiranja koherentnih i kontekstualno relevantnih odgovora, prevođenja na jezike koji nisu engleski, sažimanja teksta, odgovaranja na pitanja (opći razgovori i često postavljana pitanja), pa čak i pomoći u kreativnom pisanju ili zadacima generiranja koda.
Ono što ih čini tako moćnima je to što postoje milijarde parametara koji omogućuju modelima da uhvate složene obrasce u jeziku i izvrše razne zadatke povezane s jezikom. LLM-ovi revolucioniraju aplikacije u svemu, od chatbotova i virtualnih asistenata do generiranja sadržaja, pomoći u istraživanju i prevođenja jezika.
Kako se LLM-ovi nastavljaju razvijati i poboljšavati, preoblikovat će način na koji komuniciramo s tehnologijom i pristupamo informacijama, čineći ih kritičnim dijelom modernog digitalnog krajolika.
Kako funkcioniraju veliki jezični modeli
LLM-ovi djeluju korištenjem tehnologije dubokog učenja i velikih količina tekstualnih podataka. Ovi se modeli često temelje na arhitekturama transformatora, kao što su generativni unaprijed obučeni transformatori, koji se ističu u obradi sekvencijalnih podataka kao što su unosi teksta. LLM-ovi se sastoje od više slojeva neuronskih mreža, od kojih se svaki može fino podesiti tijekom treninga, dodatno poboljšan brojnim slojevima neuronskih mreža poznatim kao mehanizmi pažnje koji mogu prilagoditi određene dijelove skupa podataka.
Tijekom treninga, ovi modeli uče predvidjeti sljedeću riječ u rečenici na temelju konteksta koji pruža prethodna riječ. Model to postiže pripisivanjem ocjena vjerojatnosti ponavljajućim označenim riječima koje su raščlanjene na manje nizove znakova. Te se oznake zatim pretvaraju u ugrađivanja, koja su numerički prikazi tog konteksta.
Kako bi se osigurala točnost, ovaj proces uključuje obuku LLM-ova na velikom korpusu teksta (milijarde stranica), omogućujući LLM-ovima da nauče sintaksu, semantiku i konceptualne odnose kroz učenje bez snimke i samonadzirano učenje. Nakon što su obučeni na ovim podacima za obuku, LLM-ovi mogu automatski predvidjeti sljedeću riječ na temelju unosa koji prime i koristiti obrasce i znanje koje steknu za generiranje teksta. Rezultat je koherentan i kontekstualno osjetljiv jezik koji se može koristiti za širok raspon zadataka NLU-a i generiranja sadržaja.Razlog zašto se naziva “velikim” je taj što su tri elementa “računalne složenosti”, “volumena podataka” i “broja parametara modela” ogromna u usporedbi s konvencionalnim jezičnim modelima. “Računalna složenost” odnosi se na količinu posla koju računalo obrađuje, “količina podataka” odnosi se na količinu tekstualnih podataka unesenih u računalo, a “broj parametara modela” odnosi se na količinu parametara za stvaranje fleksibilnijeg programa.
Izvedba modela također se može poboljšati kroz just-in-time inženjering, just-in-time podešavanje, fino podešavanje i druge strategije, kao što je učenje s pojačanjem temeljeno na ljudskim povratnim informacijama (RLHF), kako bi se uklonila pristranost, govor mržnje i činjenične pogreške poznate kao “halucinacije”, koje su često štetni nusprodukti treninga na toliko nestrukturiranih podataka. Ovo je jedan od najvažnijih aspekata osiguravanja da su LLM-ovi poslovne razine lako dostupni i da ne izlažu organizaciju nepotrebnoj odgovornosti ili šteti ugledu organizacije.
Slučajevi upotrebe LLM-a
LLM-ovi redefiniraju sve više poslovnih procesa i dokazali su svoju svestranost u bezbrojnim slučajevima upotrebe i zadacima u svim industrijama. LLM-ovi mogu povećati konverzacijsku umjetnu inteligenciju u chatbotovima i virtualnim asistentima, kao što su IBM watsonx Assistant i Googleov BARD, kako bi poboljšali interakcije koje podržavaju izvrsnost korisničke usluge, pružajući odgovore svjesne konteksta koji oponašaju interakcije s ljudskim agentima.
LLM-ovi su također izvrsni u generiranju sadržaja i mogu automatizirati stvaranje sadržaja, uključujući postove na blogu, marketinške ili prodajne materijale i druge zadatke pisanja. U istraživanju i akademskoj zajednici pomažu u sažimanju i izvlačenju informacija iz velikih skupova podataka, ubrzavajući otkrivanje znanja. LLM-ovi također igraju ključnu ulogu u prevođenju jezika, rušeći jezične barijere pružajući točne i kontekstualno relevantne prijevode. Mogu se koristiti čak i za pisanje koda ili za “prevođenje” između programskih jezika.
Osim toga, doprinose pristupačnosti pružanjem značajki kao što su aplikacije za pretvaranje teksta u govor i generiranje sadržaja u pristupačnim formatima kako bi se pomoglo osobama s invaliditetom. Od zdravstva do financija, LLM-ovi potiču rast i promjene u industriji pojednostavljivanjem procesa, poboljšanjem korisničkog iskustva i omogućavanjem učinkovitijeg donošenja odluka temeljenih na podacima.
Najuzbudljivija stvar je to što su sve ove značajke lako dostupne, a u nekim slučajevima zapravo je potrebna samo API integracija.
Evo nekih od najvažnijih područja u kojima LLM-ovi mogu koristiti organizacijama:
- Generiranje teksta: mogućnosti generiranja jezika, kao što je pisanje e-pošte, postova na blogu ili drugog sadržaja srednje duljine na temelju upita te njihovo usavršavanje i usavršavanje. Poboljšana generacija pronalaženja (RAG) dobar je primjer za to.
- Summa sadržaja: Objedinite duge članke, novinske članke, izvješća o istraživanjima, dokumente tvrtke, pa čak i povijest kupaca u puni tekst s prilagođenim duljinama za izlazni format.
- AI pomoćnici: Chatbotovi koji mogu odgovarati na upite kupaca, obavljati pozadinske zadatke i pružati detalje na prirodnom jeziku kao dio integriranog samoposlužnog rješenja za korisničku podršku.
- Generiranje koda: Pomaže programerima u izradi aplikacija, pronalaženju grešaka u kodu i otkrivanju sigurnosnih problema u više programskih jezika, pa čak i “prevođenju” između njih.
- Analiza raspoloženja: Analizirajte tekst i odredite ton glasa kupca kako biste razumjeli povratne informacije kupaca u velikim razmjerima i pomogli u upravljanju reputacijom robne marke.
- Jezični prijevod: Pružite širu pokrivenost organizacijama na različitim jezicima i zemljopisnim područjima s tečnim prevođenjem i višejezičnim mogućnostima.
LLM-ovi će utjecati na industrije u rasponu od financija do osiguranja i ljudskih resursa do zdravstvene skrbi automatizacijom samoposluživanja korisnika, ubrzavanjem odgovora na sve veći broj zadataka i poboljšanjem točnosti, poboljšanjem usmjeravanja i inteligentnim prikupljanjem konteksta.
Objavljeno prije 2 sata
Šuška se da Google planira spojiti Chrome OS s Androidom, pa čak i stvoriti prijenosno računalo
Google ne samo da nastavlja poboljšavati Android sustav, već je također pokrenuo vlastiti Pixel Tablet, kodnog naziva Snowy, a sada se šuška da bi sljedeći korak mogao biti integracija Chrome OS-a za računala s Androidom. Ovaj potez navodno ima za cilj izazvati iPad, nudeći potpuniji operativni sustav u formatu prijenosnog računala.
Ova glasina djelomično je potvrđena najavama koje je Google objavio u lipnju ove godine, kada je najavio planove za integraciju Chrome OS-a u Android okvir i tehnologiju razvoja. Ovaj korak trebao bi ubrzati implementaciju AI tehnologija i novih značajki, dok istovremeno smanjuje razlike između ta dva sustava. Google također navodno ulaže u poboljšanja samog Android sustava, čineći ga sličnijim iskustvu koje nude prijenosna računala i tableti. Na primjer, Android bi mogao dobiti podršku za višezadaćnost u obliku prozora, dok bi podrška za vanjske monitore, miševe i fizičke tipkovnice trebala biti poboljšana.
Također, Google je već integrirao mnoge Android aplikacije u Chrome OS, čime su Chromebookovi postali konkurentniji i omogućili korisnicima bolju interoperabilnost s Android aplikacijama. Pored toga, Google je ranije pokušao koristiti Chrome OS za razvoj tablet uređaja u suradnji s proizvođačima poput Acera, no ti su pokušaji naišli na slabu prodaju, budući da tržište tableta s Chrome OS-om nije privuklo veliku pažnju.
Iako je Android prošao kroz nekoliko pokušaja da postane operativni sustav koji je sposoban pokretati uređaje poput osobnih računala ili prijenosnih računala, iskustvo korištenja nije bilo optimizirano. Iako su mnoge Android aplikacije bile dostupne, sučelje i način rada nisu bili idealni za produktivnost kakvu pružaju tradicionalna prijenosna računala. Čak i kada je iskustvo bilo funkcionalno, često nije bilo dovoljno fluidno za svakodnevnu upotrebu.
Googleova najnovija strategija sugerira da bi kombinacija Androida i Chrome OS-a mogla omogućiti prijenosna računala koja nude bogatiji operativni sustav, uz prednosti koje bi privukle korisnike koji traže više od jednostavnog uređivanja dokumenata i konzumiranja medija, kao što je slučaj s iPadom. Ako Google uspije optimizirati ovo spajanje dvaju sustava, mogli bismo svjedočiti novoj eri prijenosnih računala koja se temelje na Androidu, a koja će pružati korisnicima sličnu funkcionalnost kao i tradicionalni prijenosnici, uz fleksibilnost i ekosustav Android aplikacija.
Objavljeno prije 2 sata
Microsoft lansira Azure Integrated HSM, Azure Boost DPU i nove akceleratore za AI računalstvo na Ignite 2024
Na ovogodišnjem događaju Microsoft Ignite 2024, Microsoft je najavio niz novih tehnologija i inovacija koje imaju za cilj unaprijediti Azure usluge u oblaku, posebno u kontekstu sigurnosti podataka i računalnih resursa za umjetnu inteligenciju (AI). Među ključnim najavama su novi sigurnosni čipovi, napredni procesori, kao i inovacije u infrastrukturi koja će podržati AI radna opterećenja i poboljšati učinkovitost napajanja.
1. Azure Integrated HSM: Sigurnost podataka uz prilagođeni čip
Jedna od najvažnijih novosti je lansiranje Azure Integrated HSM (Hardware Security Module). Ovaj prilagođeni čip dizajniran je za poboljšanje sigurnosti podataka u oblačnim uslugama, te omogućuje enkripciju podataka i upravljanje ključevima bez negativnog utjecaja na performanse ili povećanja kašnjenja. Očekuje se da će Azure Integrated HSM biti integriran u sve Azure poslužitelje početkom 2025. godine.
Ovaj hardverski modul omogućava tvrtkama i organizacijama veću sigurnost podataka, posebno u kontekstu zaštite ključnih podataka i drugih osjetljivih informacija pohranjenih u oblaku. Azure Integrated HSM omogućava povjerenje u obradama podataka i ključevima unutar oblačne infrastrukture, a sve to bez smanjenja performansi, što je ključno za velike poslovne aplikacije.
2. Azure Boost DPU: Optimizacija prijenosa podataka i smanjenje potrošnje energije
Drugi značajan najavljeni proizvod je Azure Boost DPU (Data Processing Unit), prilagođeni čip za optimizaciju prijenosa podataka unutar poslužitelja. Azure Boost DPU preuzima zadatke vezane uz isporuku podataka, smanjujući tako opterećenje na osnovne računalne resurse poslužitelja. Ovaj čip omogućuje visoke performanse uz nisku potrošnju energije, što čini sustave učinkovitijima u velikim razmjerima.
Microsoft tvrdi da će korištenje Azure Boost DPU smanjiti ukupnu potrošnju energije za 3 do 4 puta u usporedbi s postojećim poslužiteljskim sustavima. Ova optimizacija je važna za umjetnu inteligenciju i računalstvo visokih performansi, jer omogućava bolje iskorištavanje računalnih resursa i manju potrebu za dodatnom energijom.
3. NVIDIA Blackwell i AMD EPYC procesori za Azure AI računalstvo
Microsoft će i dalje surađivati s NVIDIA i AMD za osiguranje najboljih procesorskih resursa za Azure poslužitelje. Za umjetnu inteligenciju i velike razmjere računalnih zadataka, Microsoft će koristiti NVIDIA GB200 platformu, dizajniranu s novom arhitekturom zaslona “Blackwell”, koja je posebno optimizirana za AI radna opterećenja. NVIDIA Blackwell je poznat po svojoj visokoj propusnosti podataka i mogućnostima ubrzanja AI modela, što je ključno za velike AI aplikacije i duboko učenje.
Također, Microsoft će integrirati AMD-ove nove EPYC poslužiteljske procesore u svoju infrastrukturu, što će omogućiti još bolje performanse za AI računalstvo na Azure platformi. Ovi procesori nude visoku računalnu snagu i skalabilnost potrebnu za rad u velikim razmjerima, posebno kada je riječ o zahtjevnim AI i analitičkim aplikacijama.
4. Tehnologija tekućeg hlađenja i napajanje za AI infrastrukturu
Kako bi zadovoljio energetske zahtjeve AI računalstva velikih razmjera, Microsoft je najavio nove dizajne sustave tekućeg hlađenja za svoje poslužitelje. Ovaj sustav omogućit će stabilniji rad poslužitelja, smanjujući potrebu za tradicionalnim sustavima hlađenja i omogućujući veću gustoću AI akceleratora unutar poslužiteljskih ormara.
Uz to, Microsoft je u suradnji s Metom razvio novu kategoriju stalaka za napajanje temeljenih na 400 V istosmjernoj struji. Ovaj sustav napajanja omogućit će poslužiteljima da dinamički prilagode vrstu napajanja potrebnog za različite razmjere AI računalstva, povećavajući energetsku učinkovitost. Prema Microsoftu, ovaj sustav može omogućiti 35% više AI akceleratora unutar svakog poslužiteljskog ormara, što doprinosi većoj učinkovitosti u poslovanju i smanjenju operativnih troškova.
Microsoftov Ignite 2024 donio je nekoliko ključnih inovacija koje će oblikovati budućnost Azure usluga u oblaku i AI računalstva. Lansiranje Azure Integrated HSM za sigurnost podataka, Azure Boost DPU za optimizaciju prijenosa podataka, kao i nove suradnje s NVIDIA i AMD za AI akceleratore, predstavlja značajan korak prema razvoju visoko učinkovite, sigurne i skalabilne infrastrukture za umjetnu inteligenciju. Ove tehnologije omogućit će organizacijama brži razvoj i implementaciju AI aplikacija, dok će im istovremeno pomoći da optimiziraju energetske i računalne resurse, smanjujući operativne troškove i omogućujući veće performanse za radna opterećenja u oblačnim okruženjima.
Objavljeno prije 3 sata
Google dodaje funkciju "memorije" u Gemini AI model za poboljšanje korisničkog iskustva
Google je najavio novu funkcionalnost za svoj Gemini Advanced AI model, koja omogućuje memoriju, odnosno sposobnost pamćenja prethodnih interakcija i preferencija korisnika. Ova funkcija, koja je trenutno dostupna samo za odabrane korisnike i nije još uvijek široko dostupna u općoj verziji, ima za cilj poboljšati efikasnost interakcija s umjetnom inteligencijom, čineći ih personaliziranijima i prilagođenijima korisničkim potrebama.
Što je funkcija memorije?
Funkcija memorije omogućuje Gemini AI modelu da zapamti specifične preferencije korisnika i njihove prethodne interakcije s modelom. Na primjer, korisnici mogu zatražiti da AI zapamti:
- Preferencije u komunikaciji, kao što je izbjegavanje tehničkog jezika ili korištenje jednostavnijih izraza.
- Dijetalne navike, poput vegetarijanskog života, kako bi AI mogao izbjegavati predlaganje mesnih jela.
- Višejezičnost, što znači da će AI simultano prevoditi sadržaj na više jezika.
- Financijska i putnička planiranja, kao što su izračunavanje dnevnih troškova ili planiranje itinerera bez potrebe za ponovnim unosom sličnih informacija.
- Korisnici mogu postaviti Gemini da pamti specifične uvjete ili zahtjeve, čime se eliminira potreba za ponovnim davanjem tih informacija prilikom svake nove interakcije.
Privatnost i kontrola korisnika
Google je istaknuo da su svi podaci o korisničkim preferencijama pohranjeni u skladu s njihovim pravilima o privatnosti. Korisnici imaju potpunu kontrolu nad podacima koje AI pamti:
- Mogu odlučiti brisati pohranjene informacije u postavkama ili dodati nove uvjete koje AI treba zapamtiti.
- Google pruža opciju za isključivanje memorije u bilo kojem trenutku, što znači da korisnici mogu povući dopuštenje za daljnje pamćenje podataka ili postavki.
Dostupnost i pretplata
Trenutno, funkcija memorije je dostupna samo korisnicima s pretplatom na Google One AI Premium. Osim toga, korisnici koji koriste Google Workspace za poslovne ili obrazovne svrhe mogu koristiti funkciju memorije putem Gemini za Google Workspace, ali samo uz odobrenje administratora sustava. Također, korisnici moraju biti stariji od 18 godina da bi koristili Gemini Advanced model.
Usporedba s drugim AI modelima
Ova nova funkcionalnost je slična onoj koju već nudi OpenAI-ov ChatGPT Plus, koji također koristi memoriju za poboljšanje personaliziranih odgovora i razumijevanje korisničkih navika. Međutim, važno je napomenuti da je funkcija memorije još uvijek u fazi testiranja i nije široko dostupna svim korisnicima.
Budućnost funkcije memorije
Google planira dodatno razvijati ovu funkcionalnost u budućnosti, s ciljem da ona postane centralni dio AI iskustva koji omogućava korisnicima bolje i brže interakcije. Korištenje memorije može značajno poboljšati produktivnost, jer korisnici neće morati ponovo unositi iste podatke, kao ni čekati na generiranje odgovora s temeljnim informacijama koje su već bile ranije pohranjene. Funkcija memorije također otvara vrata za dublje personalizirane usluge koje mogu prepoznati korisničke sklonosti, preferencije i stil komunikacije, čime će AI u budućnosti postati još korisniji alat za svakodnevnu produktivnost i interakciju.
Zaključak
Googleova funkcija memorije u Gemini Advanced AI modelu predstavlja značajan korak prema personalizaciji umjetne inteligencije i omogućava korisnicima učinkovitije interakcije s AI. S obzirom na sve veću konkurenciju na tržištu, Google pokušava iskoristiti memorijske funkcionalnosti kao ključnu prednost za svoju platformu, a istovremeno pruža korisnicima više kontrole nad njihovim podacima.
Objavljeno prije 3 sata
Antimonopolska tužba između FTC-a i Mete uskoro će ići na suđenje, možda će morati razdvojiti Instagram i WhatsAppa
Antimonopolska tužba između Savezne trgovinske komisije (FTC) i Meta Platforms (bivši Facebook) u kojoj se istražuje spajanje Meta sa Instagramom i WhatsAppom mogla bi imati dalekosežne posljedice za tehnološku industriju, a suđenje koje je pred nama možda će izazvati značajne promjene na tržištu.
Sudac James Boasberg sa saveznog suda u Washingtonu donio je odluku u kojoj se povremeno povoljan i nepovoljan stav prema obje strane. On je ograničio opseg argumenata koje FTC može koristiti u tužbi protiv Mete, posebno kada je riječ o blokiranju pristupa API-ju i natjecanju s drugim aplikacijama. Ovo je značajna pobjeda za Metu jer sudac nije dopustio da FTC koristi sve relevantne informacije u slučaju, čime je ublažen pritisak na tehnološkog diva.
Međutim, tužba neće biti povučena i dalje se razmatra mogućnost da Meta mora razdvojiti Instagram i WhatsApp, što bi moglo imati velike implikacije na poslovanje tvrtke. Odluka suca Boasberga također sugerira da će Meta imati težak zadatak pred sudom, jer iako je sudac odobrio da tužba ide na suđenje, ostavio je mnogo prostora za daljnje istraživanje mogućih šteta koje su nastale akvizicijama Instagrama i WhatsAppa. Ova tužba nije prvi pokušaj FTC-a da zaustavi spajanja velikih tehnoloških tvrtki. Tužba je počela još 2020. godine, a cilj je dokazati da su akvizicije Instagrama i WhatsAppa nelojalna konkurencija, koja je Meta učinila dominantnim igračem na tržištu društvenih mreža. Sudac je podržao argumente Mete da su akvizicije bile usmjerene na poboljšanje korisničkog iskustva, ali nije prihvatio tvrdnje da je Meta željela potisnuti konkurenciju na tržištu. Nadalje, iako Meta pokušava prikazati ove akvizicije kao pozitivne za potrošače i tržište, sve se više sugerira da bi presuda mogla rezultirati ozbiljnim promjenama, uključujući mogućnost razdvajanja dijelova kompanije. Ako sud presudi u korist FTC-a, Meta bi mogla biti prisiljena vratiti Instagram i WhatsApp u zasebne entitete, što bi imalo značajan utjecaj na njihove poslovne operacije i strategiju.
Sud pravde EU-a donio odluku o ograničavanju Meta oglašavanja
Meta će izdati multimodalni model Llama 2 , ali ne i u EU zbog regulacije
Ovaj slučaj je također zanimljiv jer je bio aktivan kroz različite administracije, uključujući i razdoblje kada je Donald Trump bio predsjednik, a kasnije je nastavljen pod administracijom Joea Bidena. Trumpova administracija bila je poznata po blažem stavu prema velikim korporacijama, dok Bidenova administracija pokazuje snažniji pristup regulaciji tržišta i kontroliranju monopolističkih praksi.
Ova tužba je važna jer daje uvid u načine na koje će se tehnološke kompanije i američka regulacija suočavati u budućnosti. Nisu samo pravna pitanja u pitanju; postoje i politička dimenzija koja utječe na način kako se tržišna konkurencija regulira. Rezultat ovog suđenja mogao bi postaviti presedan za slične slučajeve u budućnosti.
Objavljeno prije 3 sata
Veliki proizvođači smanjuju udio proizvodnje DDR4 memorije
Već početkom 2011. godine Samsung Electronics i Hynix proizveli su i najavili prvi inženjerski uzorak DDR4-SDRAM memorijskih modula na svijetu, a zatim su veliki proizvođači memorije lansirali proizvode 2012. godine. Međutim, zamjena memorije uvijek je bila spora, a do 2013. godine DDR4 je činio manje od 5% tržišta. Tek oko 2015. godine DDR4 se smatrao sveprisutnim i činio je 50% tržišta. Tada je započelo zlatno doba DDR4 na računalima.
U današnje vrijeme, s napretkom tehnologije i promjenom potražnje na tržištu, DDR4 memoriju postupno napuštaju divovi za pohranu. U svojim nedavnim pozivima za zaradu, Samsung i SK hynix naglasili su da će sljedeći put preusmjeriti svoj fokus na vrhunske proizvode s visokim maržama. Istodobno, mogu smanjiti proizvodnju DRAM i NAND flash memorije, posebno za tradicionalne vrste proizvoda.
Među njima, SK hynix planira postupno smanjivati udio proizvodnje DDR4, koji je smanjen na 30% u trećem tromjesečju ove godine s 40% u drugom tromjesečju, a dodatno smanjen na 20% u četvrtom tromjesečju. Očekuje se da će Samsung također smanjiti svoje proizvodne kapacitete uglavnom u DDR4, dok će dio svojih proizvodnih kapaciteta DDR4 prebaciti na proizvodnju naprednih proizvoda kao što su DDR5 i LPDDR5. Osim toga, Intelovi novoobjavljeni procesori za stolna računala Arrow Lake-S i matične ploče čipseta serije 800 također podržavaju samo DDR5 memoriju. AMD je već najavio da procesori serije Ryzen 7000 više ne podržavaju DDR4 memoriju.
Međutim, na tržištu još uvijek postoji mnogo elektroničkih proizvoda koji podržavaju DDR4, a cijena DDR5 je i dalje visoka, zbog čega obični potrošači preferiraju DDR4 pri odabiru.
Objavljeno prije 3 sata
WiFi 8 je u razvoju: brzina je ista kao i WiFi 7, ali veza je puno stabilnija
Wi-Fi 8, koji je još u fazi razvoja, obećava poboljšanja u stabilnosti veze, iako neće donijeti drastične promjene u brzini u odnosu na Wi-Fi 7. Iako su brzine i propusnost povezivanja, poput maksimalne fizičke brzine od 23 Gbps i širine kanala od 320 MHz, u teoriji slične onima u Wi-Fi 7, glavna promjena u Wi-Fi 8 bit će u stabilnosti veze i smanjenju fluktuacija brzine koje su česte u trenutnim Wi-Fi mrežama.
Jedan od ključnih ciljeva razvoja Wi-Fi 8 je stvaranje stabilnijih veza koje neće doživjeti nagle promjene u brzini, kao što je to često slučaj sa trenutnim Wi-Fi standardima. Wi-Fi 8 će težiti tome da korisnicima pružiti glatko, kontinuirano iskustvo bez nestabilnih uspona i padova propusnosti. Također, očekuje se da Wi-Fi 8 bude bolje opremljen za potporu internetskih veza brzine do 100 Gbps, što znači da će biti sposoban nositi se s višestrukim gigabitnim vezama, čak i u okolnostima s velikim brojem povezanih uređaja.
Tri najznačajnija tehnološka poboljšanja koja bi mogla definirati Wi-Fi 8 uključuju:
Koordiniranu prostornu ponovnu upotrebu – Ova značajka omogućuje pristupnim točkama da prilagode snagu Wi-Fi valova prema udaljenosti uređaja od usmjerivača. Uređaji koji su bliže usmjerivaču imat će stabilniju i bržu vezu, dok uređaji dalje od njega neće biti negativno pogođeni. Preliminarni testovi ove tehnologije pokazali su poboljšanje u propusnosti od čak 25%.
Koordinirano oblikovanje snopa (Coordinated Beamforming) – Ova tehnologija optimizira usmjeravanje signala između uređaja povezanim na mrežu. Dok će prednosti biti vidljive u većim okruženjima s većim brojem uređaja (kao što su uredski prostori i javne mreže), kućni korisnici s manjim brojem uređaja neće primijetiti toliko značajan skok u kvaliteti veze.
Dinamički rad podkanala – Ova značajka automatski dodjeljuje podkanale uređajima na temelju njihovih zahtjeva za propusnost. Na primjer, ako nekoliko uređaja preuzima istu datoteku, Wi-Fi 8 automatski dodjeljuje dodatne kanale za optimizaciju brzine preuzimanja. Iako je slična značajka prisutna u Wi-Fi 7, Wi-Fi 8 omogućava dinamičko, automatsko upravljanje, što čini mrežu učinkovitijom i jednostavnijom za korisnike.
Gigabyte Z890 AORUS ELITE WiFi7 recenzija
ASUS ROG Strix X870-A Gaming WiFi recenzija
ASUS ROG Strix X870E-E Gaming WiFi recenzija
Wi-Fi 8 bi mogao biti posebno koristan za poslovne i industrijske aplikacije koje zahtijevaju veliku propusnost i stabilnost, kao i za kućanstva s velikim brojem uređaja povezanih na mrežu. No, iako su brzina i propusnost veza u teoriji slične onima iz Wi-Fi 7, stabilnost i optimizacija bežičnog prijenosa podataka bit će ključne prednosti ovog novog standarda. Očekuje se da će komercijalni proizvodi koji podržavaju Wi-Fi 8 biti dostupni tek za nekoliko godina, jer je standard još uvijek u fazi razvoja, ali već sada, tehnološki noviteti koje donosi mogu značajno poboljšati svakodnevno korisničko iskustvo s bežičnim mrežama.
Objavljeno prije 3 sata
Red Hatova akvizicija Neural Magica
Red Hat je nedavno najavio akviziciju Neural Magica, pružatelja automatiziranog generativnog AI softvera i algoritama, kako bi omogućio radna opterećenja umjetne inteligencije visokih performansi bilo gdje u hibridnim okruženjima u oblaku.
Trenutno većinu umjetne inteligencije podržavaju veliki modeli prirodnog jezika (LLM), a većinu njih grade i njima upravljaju velike tehnološke tvrtke.
Razvoj okvira za zaključivanje Neural Magica u vLLM-u, u kombinaciji s Red Hatovim portfeljem AI tehnologija u hibridnim okruženjima u oblaku, omogućit će poduzećima stvaranje prilagođenih AI aplikacija u otvorenijem obliku i rad bilo gdje putem međuhibridnih okruženja u oblaku.
Neural Magic razvijen je neovisno o Massachusetts Institute of Technology (MIT) 2018. godine za razvoj softvera za zaključivanje dubokog učenja visokih performansi. Tehnološka i inženjerska stručnost Neural Magica, u kombinaciji s Red Hatovim portfeljem AI tehnologija, ubrzat će Red Hatovu viziju budućnosti umjetne inteligencije.
Matt Hicks, predsjednik i izvršni direktor Red Hata, rekao je: “Radna opterećenja umjetne inteligencije moraju funkcionirati bez obzira na to gdje se podaci organizacije nalaze u hibridnim oblacima. Kao rezultat toga, potrebne su fleksibilne, standardizirane i otvorene platforme i alati kako bi se organizacijama omogućilo da odaberu okruženje, resurse i arhitekturu koja najbolje odgovara njihovim operativnim i podatkovnim potrebama. Uzbuđeni smo što možemo nadopuniti naš portfelj umjetne inteligencije usmjerene na hibridni oblak revolucionarnim inovacijama umjetne inteligencije tvrtke Neural Magic, koje nas pokreću ne samo kao ‘Red Hat’ otvorenog koda, već i kao ‘Red Hat’ u umjetnoj inteligenciji.”
Brian Stevens, izvršni direktor tvrtke Neural Magic, rekao je: “Industrija je uvijek iznova dokazala da otvoreni kod može potaknuti inovacije snagom suradnje zajednice. Neural Magic okuplja vrhunske stručnjake za inženjering performansi umjetne inteligencije u industriji kako bi se usredotočili na stvaranje otvorenih, višeplatformskih i ultra učinkovitih LLM runtimea. Pridruživanje Red Hatu nije samo kulturno uklapanje, već i način da se ubrza put transformacije umjetne inteligencije za tvrtke svih veličina.”
Dario Gil, viši potpredsjednik i predsjednik IBM Researcha, rekao je da će virtualizacija i LLM-ovi u oblaku temeljeni na otvorenim temeljima postati industrijski standard jer korisnici aktivno nastoje skalirati umjetnu inteligenciju u hibridnim okruženjima. “Kombinacija Red Hatovog vodstva u otvorenom kodu, IBM Graniteovog učinkovitog modela otvorenog koda i Neural Magicovog višeplatformskog rješenja za proširenje umjetne inteligencije pružit će tvrtkama kontrolu i otpornost koja im je potrebna za lokalnu implementaciju umjetne inteligencije.“
Objavljeno prije 3 sata
Priča se da NVIDIA-ina nova generacija Blackwell čipova ima problema s pregrijavanjem. Meta i Google paničare
Prema The Informationu, utvrđeno je da NVIDIA-ina sljedeća generacija Blackwell procesora ima ozbiljne probleme s pregrijavanjem u poslužiteljskim ormarima. Ovi problemi doveli su do prilagodbi dizajna i kašnjenja, ostavljajući velike kupce kao što su Google, Meta i Microsoft zabrinuti hoće li moći implementirati Blackwell poslužitelje kako je planirano.
Blackwell GPU-ovi dizajnirani su za umjetnu inteligenciju i računalstvo visokih performansi (HPC), već se suočava s kašnjenjima, a njegovi poslužitelji koji ga podržavaju također se pregrijavaju. To može dovesti do toga da se neki korisnici zabrinu da nemaju dovoljno vremena za pokretanje svog novog podatkovnog centra. Prema ljudima koji su upoznati s tim pitanjem, Blackwell grafička procesorska jedinica se pregrijava kada je spojena u poslužiteljski stalak dizajniran da primi do 72 čipa. Trenutno je Nvidia više puta tražila od svojih dobavljača da promijene dizajn stalka kako bi riješili problem pregrijavanja. Kao odgovor, Nvidia je u izjavi rekla: “Nvidia surađuje s vodećim pružateljima usluga u oblaku kao sastavni dio našeg inženjerskog tima i procesa. Inženjerske iteracije su normalne i očekivane.”
Vrijedno je napomenuti da ovo nije prvi put da je Nvidijin Blackwell AI čip izložen problemima, što može utjecati na isporuku. U ožujku ove godine Nvidia je izdala Blackwell čip i rekla da će ga isporučiti u drugom tromjesečju. Izvršni direktor Nvidije (NVIDIA, također poznat kao NVIDIA) Jensen Huang demonstrira NVIDIA-inu platformu Blackwell (Reuters) tijekom govora 2. lipnja 2024 Nvidijin Blackwell čip uzima dva komada silicija veličine prethodnog proizvoda tvrtke i kombinira ih u jednu komponentu koja je 30 puta brža pri obavljanju zadataka kao što su odgovori chatbota. No, nakon toga, čip je odgođen zbog “greške u dizajnu”, za koju analitičari vjeruju da bi mogla utjecati na kupce kao što su Meta, Google i Microsoft.
U listopadu je izvršni direktor Nvidije Jensen Huang rekao da su uz pomoć dugogodišnjeg partnera TSMC-a ispravljeni nedostaci u dizajnu Nvidijinog najnovijeg Blackwell AI čipa. Očekivao je da će Blackwellovi žetoni biti isporučeni u četvrtoj četvrtini. Sada, prema procjenama medija, poboljšani Blackwell GPU neće biti isporučen najranije do kraja siječnja sljedeće godine. Međutim, do sada Nvidia nije obavijestila kupce da će proizvod i dalje kasniti. Istodobno, Nvidijini kupci razmatraju druge opcije. Izvršni direktor tvrtke za računalstvo u oblaku koja je naručila stalak rekao je da su Blackwellovi problemi naveli tvrtku da razmisli o kupnji više Nvidijinih Hopper čipova trenutne generacije. Analiza kaže da bi odluka kupaca da kupe više Hopper čipova mogla povećati Nvidijinu kratkoročnu zaradu, a analitičari i ulagači procjenjuju veće profitne marže za seriju Hopper.
NVIDIA će sljedeće godine lansirati PC čipove
NVIDIA detaljno opisuje kako osnažiti svijet umjetne inteligencije
Nvidia nastavlja trend velike razlike u snazi vodećih GPU-a nove generacije
Osim toga, Nvidia će objaviti svoje treće tromjesečno izvješće u srijedu po lokalnom vremenu, što će biti njezino prvo izvješće o zaradi nakon što bude uključeno u Dow. Kao najveća svjetska tvrtka po tržišnoj kapitalizaciji, NVIDIA-ino izvješće o zaradi moglo bi pokrenuti veliki val na američkom tržištu dionica i postati još jedna “lopatica” za američko tržište dionica. Nakon što je rast potaknut izborima zastao, pažnja ulagača mogla bi se preusmjeriti na tehnološke dionice i trgovanje umjetnom inteligencijom. Prošli tjedan brojni analitičari investicijskih banaka podigli su svoje ciljane cijene za Nvidiju:
- Joseph Moore podigao je svoju ciljanu cijenu na 160 dolara sa 150 dolara;
- Mizuhoov Vijay Rakesh podigao je svoju ciljanu cijenu na 165 dolara sa 140 dolara;
- Timothy Arcuri iz UBS-a podigao je svoju ciljanu cijenu na 185 dolara sa 150 dolara;
- Harsh Kumar Piper Sandler podigao je ciljanu cijenu na 175 dolara sa 140 dolara.
Objavljeno prije 5 sati
electronica 2024: Globalni izlog inovacija u elektronici
Ovogodišnji minhenska electronica 2024, vodeći svjetski sajam elektronike, završio je svoje uspješno četverodnevno održavanje u Münchenu, pokazujući nepokolebljivu predanost industrije inovacijama i održivosti. S 3.480 izlagača iz 59 zemalja i regija i približno 80.000 posjetitelja iz oko 100 zemalja, electronica je učvrstila svoju poziciju globalne platforme za rastuće “All Electric Society”.
Put prema održivoj budućnosti
Izložbene dvorane vrvile su od aktivnosti dok su sudionici istraživali vrhunske tehnologije u cijelom spektru elektronike. Ključne teme – uključujući umjetnu inteligenciju (AI), budućnost mobilnosti i ključni razvoj mladih talenata – potaknule su živahne rasprave tijekom sajma i njegovog opsežnog popratnog programa.
Dr. Reinhard Pfeiffer, glavni izvršni direktor Messe München, osvrnuo se na izvanredan uspjeh: “Već 60 godina elektronika je ključna točka susreta globalne elektroničke industrije. Ovogodišnji događaj u Münchenu, vodećem tehnološkom središtu, poslužio je kao dokaz da izvanredna inovativna sposobnost ovog sektora.”
Otpornost industrije i optimizam
Dr. Gunther Kegel, predsjednik Njemačke udruge elektro i digitalne industrije (ZVEI), priznao je izazove s kojima se industrija suočava, ističući nepokolebljivo povjerenje u njezine dugoročne izglede. Izjavio je: “Unatoč nedavnim gospodarskim vjetrovima, megatrendovi elektrifikacije, digitalizacije i automatizacije ostaju čvrsto netaknuti. Očekujemo oporavak sektora elektroničkih komponenti, koji je doživio pad prodaje nakon nekoliko snažnih godina.”
Globalno sudjelovanje i pozitivne povratne informacije
Direktorica izložbe Katja Stolle istaknula je međunarodni doseg electronica 2024.: “Ovogodišnje izdanje bilo je više međunarodno nego ikad prije. Pozitivna atmosfera bila je opipljiva u svim dvoranama unatoč izazovnom globalnom gospodarskom krajoliku.” Caroline Pannier, zamjenica direktora izložbe koja će u prosincu preuzeti vodstvo elektronike, ponovila je ovo mišljenje, izjavivši: “Nepogrešivi ‘duh elektronike’ bio je očit u svakoj interakciji i raspravi.”
Razmjena znanja i inicijative usmjerene na budućnost
Sveobuhvatni program podrške u Electronici pružio je obilje uvida i inspiracije. Stručnjaci su podijelili svoje znanje kroz prezentacije orijentirane na primjenu u šest faza, pokrivajući gotovo svaki aspekt elektroničke industrije. Nova područja fokusa uključivala su AI strojno učenje, industrijsku kontrolu i žene u tehnologiji, dok su rješenja održivosti i kružnog gospodarstva bila istaknuta tijekom događaja.
Platforma Fast Forward predstavljala je inovativne start-upove, dok je Career Area povezivala tražitelje posla s vodećim tvrtkama u sektoru. Dan mladih talenata, namijenjen studentima i učenicima, pokazao se iznimno uspješnim.
SEMICON Europa: Komplementarni uspjeh
Održan paralelno s Electronicom, SEMICON Europa predstavio je rješenja za proizvodnju poluvodiča u dvije namjenske hale. Laith Altimime, predsjednik SEMI Europe, izrazio je zadovoljstvo rekordnom posjećenošću događaja i rasprodanim izložbenim prostorom.
electronica 2024 u brojkama
- Izlagači: 3480 iz 59 zemalja i regija (76% međunarodno)
- Posjetitelji: Otprilike 80 000 iz oko 100 zemalja i regija (54% internacionalno)
- Zemlje s najvećim brojem posjetitelja: Njemačka, Italija, Kina, Francuska, Austrija, Ujedinjeno Kraljevstvo, Švicarska, SAD, Španjolska, Nizozemska, Poljska.
Gledajući unaprijed
electronica 2026 održat će se u Münchenu od 10. do 13. studenog 2026. godine.
Forum
Objavljeno prije 10 minuta
S.T.A.L.K.E.R. 2: Heart of ChornobylObjavljeno prije 16 minuta
Serije - dojmovi, komentari i preporukeObjavljeno prije 21 minuta
Sam svoj majstor - razni radovi po kući/stanuObjavljeno prije 45 minuta
Rasprava o akcijama, popustima i super niskim cijena-isključivo informatička oprema!Objavljeno prije 48 minuta
HP ELITEBOOK laptopiNovosti
Što su veliki jezični modeli ili LLM?
Što je LLM? Veliki jezični modeli (LLM) su klasa temeljnih modela koji su obučeni na velikim količinama podataka kako bi pružili temeljne mogućnosti potrebne za pokretanje višestrukih slučajeva upotrebe i aplikacija te rješavanje velikog br... Pročitaj više
Šuška se da Google planira spojiti Chrome OS s Androidom, pa čak i stvoriti prijenosno računalo
Google ne samo da nastavlja poboljšavati Android sustav, već je također pokrenuo vlastiti Pixel Tablet, kodnog naziva Snowy, a sada se šuška da bi sljedeći korak mogao biti integracija Chrome OS-a za računala s Androidom. Ovaj potez navodno... Pročitaj više
Microsoft lansira Azure Integrated HSM, Azure Boost DPU i nove akceleratore za AI računalstvo na Ignite 2024
Na ovogodišnjem događaju Microsoft Ignite 2024, Microsoft je najavio niz novih tehnologija i inovacija koje imaju za cilj unaprijediti Azure usluge u oblaku, posebno u kontekstu sigurnosti podataka i računalnih resursa za umjetnu inteligenc... Pročitaj više
Google dodaje funkciju "memorije" u Gemini AI model za poboljšanje korisničkog iskustva
Google je najavio novu funkcionalnost za svoj Gemini Advanced AI model, koja omogućuje memoriju, odnosno sposobnost pamćenja prethodnih interakcija i preferencija korisnika. Ova funkcija, koja je trenutno dostupna samo za odabrane korisnike... Pročitaj više
Antimonopolska tužba između FTC-a i Mete uskoro će ići na suđenje, možda će morati razdvojiti Instagram i WhatsAppa
Antimonopolska tužba između Savezne trgovinske komisije (FTC) i Meta Platforms (bivši Facebook) u kojoj se istražuje spajanje Meta sa Instagramom i WhatsAppom mogla bi imati dalekosežne posljedice za tehnološku industriju, a suđenje koje je... Pročitaj više
Sve novosti