OpenAI je napravio neočekivani zaokret u svijetu umjetne inteligencije. lansiranje de GPT-OSS, njihov prvi model otvorenog koda u više od pet godina. Ovaj razvoj događaja označava odstupanje od nedavne strategije kompanije, koja se prvenstveno oslanjala na vlasničke modele i zatvorene usluge. Dolaskom GPT-OSS-a, OpenAI se vraća svojim korijenima, otvarajući vrata svima ili entitetima da pristupe, pokrenu i prilagode moćan jezički model bez oslanjanja na svoju cloud platformu ili internet veze.
Novi model dostupan je u dvije verzije: jedna sa 120.000 milijardi parametara i lakša verzija sa 20.000 milijardi parametara.Najmoćnija varijanta može raditi na jednoj profesionalnoj grafičkoj kartici sa najmanje 80 GB memorije, dok je slabija verzija namijenjena mainstream računarima i laptopima sa 16 GB RAM-a, što... značajno demokratizuje pristup naprednim mogućnostima vještačke inteligencijeObje verzije mogu se besplatno preuzeti s platformi poput Hugging Face i implementirati na popularnim servisima poput Azurea ili AWS-a.
Tehničke karakteristike i korištena tehnologija
con GPT-OSSOpenAI je predstavio dva modela dizajnirana s arhitekturom zasnovanom na Transformator i mješavina stručnjaka (MoE). To omogućava optimizirajte korištenje memorije i latenciju Aktiviranjem samo odabranog dijela stručnjaka po ulaznom tokenu, povećava se efikasnost bez žrtvovanja snage. Verzija od 120B koristi 36 blokova i aktivira 5.100 milijardu parametara po tokenu, dok verzija od 20B koristi 24 bloka i aktivira 3.600 milijardi, što olakšava rad na pristupačnijem hardveru.
Oba modela su obučena prvenstveno na podacima na engleskom jeziku iz područja STEM, programiranje i opće znanje, uključujući dodatnu fazu nadziranog prilagođavanja i pojačanja kako biste poboljšali svoje usklađivanje s ljudskim uputamaMeđu njegovim mogućnostima su i lanac misli, mogućnost razbijanja međukoraka prije davanja odgovora, kao i mogućnost korištenja vanjskih alata poput pregledavanja weba ili izvršavanja Python koda.
Dostupnost, licenciranje i opcije integracije
Jedna od velikih prednosti GPT-OSS-a je njegova Licenca Apache 2.0, što eliminira mnoga uobičajena ograničenja drugih zatvorenih modela: omogućava njegovo komercijalna upotreba, redistribucija i integracija u svim vrstama projekata, od malih startupova do velikih javnih tijela ili istraživačko-razvojnih inicijativa. Težine modela dostupne su u MXFP4 formatu i imaju referentne implementacije u PyTorchu i Apple Metalu, kao i potpunu kompatibilnost s alatima kao što su Ollama, llama.cpp, LM Studio i vLLM, što olakšava njegovu upotrebu kako u profesionalnom, tako i u kućnom okruženju.
Instalacija i puštanje u rad GPT-OSS-20B je posebno jednostavno zahvaljujući uslužnim programima kao što je LM Studio, koji vam omogućava da korisnici bez iskustva u programiranju Preuzmite i testirajte model lokalno pomoću grafičkog interfejsa. Osim toga, OpenAI je objavio detaljnu dokumentaciju i preporuke za fino podešavanje i prilagođavanje modela, kao i spremne integracije za cloud i on-premise platforme.
Sigurnost, testiranje i odgovoran pristup
Pokretanje GPT-OSS-a nije bilo usmjereno samo na otvorenost, već i na sigurnost i odgovorna upotreba modela. OpenAI je ugradio nove mehanizme pregleda i validacije kako bi se izbjegli rizici povezani sa zloupotrebom, posebno u osjetljivim područjima kao što su sajber sigurnost ili stvaranje zlonamjernih agenata. U tu svrhu implementirao je metodologiju suparničkog testiranja (crveno timsko djelovanje), s vanjskim pregledima od strane nezavisnih stručnjaka i protokolima za simuliranje ekstremnih scenarija eksploatacije.
Uz objavljivanje modela, OpenAI je pokrenuo crveni timski izazov s financijskim nagradama za one koji identificiraju ranjivosti ili problematična ponašanja, tražeći tako aktivnu saradnju globalne zajednice u otkrivanju rizika. Osim toga, GPT-OSS otkriva svoje lanac zaključivanja, olakšavajući reviziju i praćenje odgovora kako bi se izbjegle pristranosti ili osjetljive greške.
Performanse i poređenje s drugim otvorenim modelima
U akademski kriteriji i testovi logičkog zaključivanjaGPT-OSS-120B je ravan, a u nekim aspektima čak i nadmašuje nedavne vlasničke modele kompanije OpenAI, kao što je o4-mini, a u određenim kontekstima nadmašuje i druge poput DeepSeek R1 ili serije Llama. Verzija 20B, prilagođena kućnim uređajima, održava... odličan odnos između efikasnosti i kapaciteta, sa vrlo konkurentnim rezultatima u zadacima iz matematike, kodiranja i zdravlja.
OpenAI upozorava da ovi otvoreni modeli mogu predstavljati veća sklonost ka "halucinacijama" (činjenične greške) u poređenju sa njihovim ekvivalentima u oblaku, s obzirom na razlike u obuci i praćenju. Međutim, korisnici sada imaju mogućnost korištenja modela visokog nivoa bez potrebe za online uslugama.