Kako je GPT-4 učio, koliko je jak i pametan?

·

Kako je GPT-4  učio,  koliko je jak i pametan

OpenAI je najavio četvrtu verziju velikog jezičnog modela(LLM) GPT-4 (Generative Pre-trained Transformer) koji uči strojeve da razgovaraju, komuniciraju i stvaraju poput ljudi.

gpt4_prijava

Obuka GPT-4 uz pregled ključnih riječi, programa klasifikacije za identificiranje i brisanje pornografskih informacija u podacima završena je u kolovozu prošle godine. Ostatak vremena trošio se na fino podešavanje, nadogradnju i uklanjanje stvaranja opasnog sadržaja. Angažirano je više od 50 stručnjaka iz područja rizika usklađivanja umjetne inteligencije, kibernetičke sigurnosti, biološkog rizika, povjerenja i sigurnosti te međunarodne sigurnosti kako bi proveli testiranje ponašanja modela u visokorizičnim područjima. Model je treniran korištenjem Microsoftovog (MSFT.US) Azure, ali nisu objavljene pojedinosti o veličini modela niti hardveru korištenom za treniranje.

gpt4_podrška za 26 jezika

Aspekti u kojima je GPT-4 postigao korak naprijed

  • limit unosa teksta povećan je sa 8000 riječi na preko 25 000 riječi uz mogućnost pretraživanja i analize dokumenata
    podrška za više od 26 različitih jezika (Microsoft Azure Translate)
  • 40 posto veća vjerojatnost da će dati točne odgovore od GPT-3.5 i 82 posto manju vjerojatnost da će odgovoriti na pitanja koja bi trebala biti odbijena.
  • uspješnost rješavanja testa iz prava, matematike, kemije, fizike i drugih predmeta je blizu uspješnosti najboljih učenika. Uzimajući simulirani pravosudni ispit kao primjer, rezultat može se svrstati u prvih 10 posto ispitanika, dok prethodna generacija GPT-3.5 postiže donjih 10 posto.
  • podrška unosa slika i snažna sposobnost njihovog prepoznavanja i razumijevanja te daljnje generiranje tekstualnihi interaktivnih izlaza. Primjerice, na temelju ručno nacrtanih skica u deset sekundi generira kod web stranice

gpt4_skica weba i rezultat

lijevo je rukom nacrtana skica, a desno generirani kod i web stranica

  • pohrana se povećala s prijašnjih 4096 tokena (oko 8000 riječi) na 32768 tokena (oko 64000 riječi), čime može “zapamtiti” više informacija koje korisnik daje u duljem razgovoru te tako bolje razumjeti informacije
  • manja vjerojatnost odgovora na zahtjeve kao što su medicinski savjeti ili samoozljeđivanje itd.
  • dodana je stilska operativnost kako bi korisnici mogli diktirati stil kako bi se do određene mjere prilagodio njihovom iskustvu što poboljšava autentičnost i pouzdanost

gpt4_Uspješnost testa GPT-4 iz prava, matematike, kemije, fizike i drugih predmeta gpt4_više kontroliranih rizika

PROČITAJTE JOŠ

Sam Atman – ChatGPT neće tako brzo promijeniti postojeće usluge pretraživanja

Uz ChatGPT lako je stvoriti zlonamjerni kod

Što je ChatGPT – trend koji će eksplodirati 2023.

 gpt4_povećanje limita riječi gpt4_demo analize slike

Ograničenja još uvijek postoje

GPT-4 još uvijek ima ograničenja kao i raniji GPT modeli poput generiranja štetnih prijedloga, pogrešnog koda, netočnih informacija posebno kada korisnici postavljaju pitanja koja su premalena da bi bila uključena u bazu podataka i još uvijek je nemoguće da odgovori budu 100 posto pouzdani. U isto vrijeme, GPT-4 podaci o obuci su od rujna 2021. što znači da nema dovoljno znanja o informacijama nakon ove vremenske točke.

Također, pitanja vezana uz sigurnost prikupljenih podataka i dalje postoje. Nekoliko sati nakon izlaska modela, izraelski startup za kibernetičku sigurnost Adversa AI objavio je post na blogu koji pokazuje kako zaobići OpenAI-jeve filtre sadržaja i natjerati GPT-4 da generira phishing e-poruke, uvredljive opise homoseksualaca i druge poticaje.

No, kao što je OpenAI rekao, predstoji još puno posla, koji korisnici i programeri trebaju kontinuirano testirati, a zajednica graditi, istraživati i pridonositi modelu, kako bi model nastavio činiti sve jačim i jačim.

GPT-4 tri metode pristupa

Pretplatnici ChatGPT Plus od 20 USD mjesečno mogu već isprobati najanoviju onačicu izravno na chat.openai.com dok ostali zainteresirani i programeri trebaju se pridružiti listi čekanja za pristup. Ali budući Microsoftova nova verzija Bing pretraživanja izravno koristi GPT-4, to je još jedan način isprobavanja.

 GPT-4 Developer Livestream