Kako je GPT-4 učio, koliko je jak i pametan?

OpenAI je najavio četvrtu verziju velikog jezičnog modela(LLM) GPT-4 (Generative Pre-trained Transformer) koji uči strojeve da razgovaraju, komuniciraju i stvaraju poput ljudi.

Obuka GPT-4 uz pregled ključnih riječi, programa klasifikacije za identificiranje i brisanje pornografskih informacija u podacima završena je u kolovozu prošle godine. Ostatak vremena trošio se na fino podešavanje, nadogradnju i uklanjanje stvaranja opasnog sadržaja. Angažirano je više od 50 stručnjaka iz područja rizika usklađivanja umjetne inteligencije, kibernetičke sigurnosti, biološkog rizika, povjerenja i sigurnosti te međunarodne sigurnosti kako bi proveli testiranje ponašanja modela u visokorizičnim područjima. Model je treniran korištenjem Microsoftovog (MSFT.US) Azure, ali nisu objavljene pojedinosti o veličini modela niti hardveru korištenom za treniranje.

Aspekti u kojima je GPT-4 postigao korak naprijed

limit unosa teksta povećan je sa 8000 riječi na preko 25 000 riječi uz mogućnost pretraživanja i analize dokumenata
podrška za više od 26 različitih jezika (Microsoft Azure Translate)

40 posto veća vjerojatnost da će dati točne odgovore od GPT-3.5 i 82 posto manju vjerojatnost da će odgovoriti na pitanja koja bi trebala biti odbijena.

uspješnost rješavanja testa iz prava, matematike, kemije, fizike i drugih predmeta je blizu uspješnosti najboljih učenika. Uzimajući simulirani pravosudni ispit kao primjer, rezultat može se svrstati u prvih 10 posto ispitanika, dok prethodna generacija GPT-3.5 postiže donjih 10 posto.

podrška unosa slika i snažna sposobnost njihovog prepoznavanja i razumijevanja te daljnje generiranje tekstualnihi interaktivnih izlaza. Primjerice, na temelju ručno nacrtanih skica u deset sekundi generira kod web stranice

lijevo je rukom nacrtana skica, a desno generirani kod i web stranica

pohrana se povećala s prijašnjih 4096 tokena (oko 8000 riječi) na 32768 tokena (oko 64000 riječi), čime može “zapamtiti” više informacija koje korisnik daje u duljem razgovoru te tako bolje razumjeti informacije

manja vjerojatnost odgovora na zahtjeve kao što su medicinski savjeti ili samoozljeđivanje itd.

dodana je stilska operativnost kako bi korisnici mogli diktirati stil kako bi se do određene mjere prilagodio njihovom iskustvu što poboljšava autentičnost i pouzdanost

PROČITAJTE JOŠ

Sam Atman – ChatGPT neće tako brzo promijeniti postojeće usluge pretraživanja

Uz ChatGPT lako je stvoriti zlonamjerni kod

Što je ChatGPT – trend koji će eksplodirati 2023.

Ograničenja još uvijek postoje

GPT-4 još uvijek ima ograničenja kao i raniji GPT modeli poput generiranja štetnih prijedloga, pogrešnog koda, netočnih informacija posebno kada korisnici postavljaju pitanja koja su premalena da bi bila uključena u bazu podataka i još uvijek je nemoguće da odgovori budu 100 posto pouzdani. U isto vrijeme, GPT-4 podaci o obuci su od rujna 2021. što znači da nema dovoljno znanja o informacijama nakon ove vremenske točke.

Također, pitanja vezana uz sigurnost prikupljenih podataka i dalje postoje. Nekoliko sati nakon izlaska modela, izraelski startup za kibernetičku sigurnost Adversa AI objavio je post na blogu koji pokazuje kako zaobići OpenAI-jeve filtre sadržaja i natjerati GPT-4 da generira phishing e-poruke, uvredljive opise homoseksualaca i druge poticaje.

No, kao što je OpenAI rekao, predstoji još puno posla, koji korisnici i programeri trebaju kontinuirano testirati, a zajednica graditi, istraživati i pridonositi modelu, kako bi model nastavio činiti sve jačim i jačim.

GPT-4 tri metode pristupa

Pretplatnici ChatGPT Plus od 20 USD mjesečno mogu već isprobati najanoviju onačicu izravno na chat.openai.com dok ostali zainteresirani i programeri trebaju se pridružiti listi čekanja za pristup. Ali budući Microsoftova nova verzija Bing pretraživanja izravno koristi GPT-4, to je još jedan način isprobavanja.

Aspekti u kojima je GPT-4 postigao korak naprijed

PROČITAJTE JOŠ

Sam Atman – ChatGPT neće tako brzo promijeniti postojeće usluge pretraživanja

Uz ChatGPT lako je stvoriti zlonamjerni kod

Što je ChatGPT – trend koji će eksplodirati 2023.

Ograničenja još uvijek postoje

GPT-4 tri metode pristupa

GPT-4 Developer Livestream

DRUGE NOVOSTI

Nova QNAP QSW 2000 serija switcheva pojednostavljuje mrežnu arhitekturu

Nadogradite svoj Office uz ograničen budžet: Office 2024 Pro za 19,99 € i Office 2021 Home & Business za Mac po povoljnoj cijeni

Predsjednik ADATA-e upozorava: Globalna nestašica RAM-a mogla bi potrajati sljedećih deset godina

Arhitektura NVIDIA Vera: Kako je prilagođeni Arm CPU dizajniran za eru agentske umjetne inteligencije