OpenAI revolucionira umjetnu inteligenciju s GPT-OSS-om: otvorenim modelom ponderiranja za sve

  • GPT-OSS označava povratak OpenAI-a modelima otvorene težine, dostupnim u dvije verzije (parametri 120B i 20B), dizajniranim da olakšaju lokalno izvršavanje i prilagođavanje.
  • Oba modela nude napredno zaključivanje, generiranje koda i korištenje alata, a razvijeni su prema strogo primjenjivoj metodologiji sigurnosnog testiranja.
  • Licencirana distribucija Apache 2.0 omogućava slobodno korištenje, modifikaciju i komercijalnu eksploataciju, otvarajući nove mogućnosti za preduzeća, programere i javne organizacije.
  • Implementacija GPT-OSS-a stavlja OpenAI u direktnu konkurenciju s rješenjima poput Llama i DeepSeek, potičući demokratizaciju i dostupnost umjetne inteligencije.

GPT-OSS

OpenAI je napravio neočekivani zaokret u svijetu umjetne inteligencije. lansiranje de GPT-OSS, njihov prvi model otvorenog koda u više od pet godina. Ovaj razvoj događaja označava odstupanje od nedavne strategije kompanije, koja se prvenstveno oslanjala na vlasničke modele i zatvorene usluge. Dolaskom GPT-OSS-a, OpenAI se vraća svojim korijenima, otvarajući vrata svima ili entitetima da pristupe, pokrenu i prilagode moćan jezički model bez oslanjanja na svoju cloud platformu ili internet veze.

Novi model dostupan je u dvije verzije: jedna sa 120.000 milijardi parametara i lakša verzija sa 20.000 milijardi parametara.Najmoćnija varijanta može raditi na jednoj profesionalnoj grafičkoj kartici sa najmanje 80 GB memorije, dok je slabija verzija namijenjena mainstream računarima i laptopima sa 16 GB RAM-a, što... značajno demokratizuje pristup naprednim mogućnostima vještačke inteligencijeObje verzije mogu se besplatno preuzeti s platformi poput Hugging Face i implementirati na popularnim servisima poput Azurea ili AWS-a.

Tehničke karakteristike i korištena tehnologija

con GPT-OSSOpenAI je predstavio dva modela dizajnirana s arhitekturom zasnovanom na Transformator i mješavina stručnjaka (MoE). To omogućava optimizirajte korištenje memorije i latenciju Aktiviranjem samo odabranog dijela stručnjaka po ulaznom tokenu, povećava se efikasnost bez žrtvovanja snage. Verzija od 120B koristi 36 blokova i aktivira 5.100 milijardu parametara po tokenu, dok verzija od 20B koristi 24 bloka i aktivira 3.600 milijardi, što olakšava rad na pristupačnijem hardveru.

Oba modela su obučena prvenstveno na podacima na engleskom jeziku iz područja STEM, programiranje i opće znanje, uključujući dodatnu fazu nadziranog prilagođavanja i pojačanja kako biste poboljšali svoje usklađivanje s ljudskim uputamaMeđu njegovim mogućnostima su i lanac misli, mogućnost razbijanja međukoraka prije davanja odgovora, kao i mogućnost korištenja vanjskih alata poput pregledavanja weba ili izvršavanja Python koda.

besplatan softver
Vezani članak:
Slobodni softver suočava se s izazovom umjetne inteligencije i sukobima s velikim tehnološkim kompanijama

Dostupnost, licenciranje i opcije integracije

Jedna od velikih prednosti GPT-OSS-a je njegova Licenca Apache 2.0, što eliminira mnoga uobičajena ograničenja drugih zatvorenih modela: omogućava njegovo komercijalna upotreba, redistribucija i integracija u svim vrstama projekata, od malih startupova do velikih javnih tijela ili istraživačko-razvojnih inicijativa. Težine modela dostupne su u MXFP4 formatu i imaju referentne implementacije u PyTorchu i Apple Metalu, kao i potpunu kompatibilnost s alatima kao što su Ollama, llama.cpp, LM Studio i vLLM, što olakšava njegovu upotrebu kako u profesionalnom, tako i u kućnom okruženju.

Instalacija i puštanje u rad GPT-OSS-20B je posebno jednostavno zahvaljujući uslužnim programima kao što je LM Studio, koji vam omogućava da korisnici bez iskustva u programiranju Preuzmite i testirajte model lokalno pomoću grafičkog interfejsa. Osim toga, OpenAI je objavio detaljnu dokumentaciju i preporuke za fino podešavanje i prilagođavanje modela, kao i spremne integracije za cloud i on-premise platforme.

Sigurnost, testiranje i odgovoran pristup

Pokretanje GPT-OSS-a nije bilo usmjereno samo na otvorenost, već i na sigurnost i odgovorna upotreba modela. OpenAI je ugradio nove mehanizme pregleda i validacije kako bi se izbjegli rizici povezani sa zloupotrebom, posebno u osjetljivim područjima kao što su sajber sigurnost ili stvaranje zlonamjernih agenata. U tu svrhu implementirao je metodologiju suparničkog testiranja (crveno timsko djelovanje), s vanjskim pregledima od strane nezavisnih stručnjaka i protokolima za simuliranje ekstremnih scenarija eksploatacije.

Uz objavljivanje modela, OpenAI je pokrenuo crveni timski izazov s financijskim nagradama za one koji identificiraju ranjivosti ili problematična ponašanja, tražeći tako aktivnu saradnju globalne zajednice u otkrivanju rizika. Osim toga, GPT-OSS otkriva svoje lanac zaključivanja, olakšavajući reviziju i praćenje odgovora kako bi se izbjegle pristranosti ili osjetljive greške.

Performanse i poređenje s drugim otvorenim modelima

U akademski kriteriji i testovi logičkog zaključivanjaGPT-OSS-120B je ravan, a u nekim aspektima čak i nadmašuje nedavne vlasničke modele kompanije OpenAI, kao što je o4-mini, a u određenim kontekstima nadmašuje i druge poput DeepSeek R1 ili serije Llama. Verzija 20B, prilagođena kućnim uređajima, održava... odličan odnos između efikasnosti i kapaciteta, sa vrlo konkurentnim rezultatima u zadacima iz matematike, kodiranja i zdravlja.

OpenAI upozorava da ovi otvoreni modeli mogu predstavljati veća sklonost ka "halucinacijama" (činjenične greške) u poređenju sa njihovim ekvivalentima u oblaku, s obzirom na razlike u obuci i praćenju. Međutim, korisnici sada imaju mogućnost korištenja modela visokog nivoa bez potrebe za online uslugama.

alibaba AI
Vezani članak:
Alibaba je izdala AI otvorenog koda kako bi se takmičila protiv Llame 2