Google predstavlja Gemma 4: Nove i snažnije otvorene AI modele
Novi modeli donose napredne mogućnosti rasuđivanja pod Apache 2.0 licencom
Google je predstavio Gemma 4, novu generaciju svojih otvorenih jezičnih modela dizajniranih za napredno rasuđivanje i agentne zadatke. Modeli su dostupni pod popustljivom Apache 2.0 licencom i donose značajan skok u performansama s obzirom na broj parametara, što ih čini iznimno korisnima za programere i istraživače širom svijeta.
Ključni detalji
Google je izdao Gemma 4 obitelj u četiri različite verzije: Effective 2B (E2B) i Effective 4B (E4B) koje su optimizirane za mobilne uređaje, te veće 26B Mixture of Experts (MoE) i 31B Dense modele za složenije zadatke. Svi modeli iz ove obitelji nativno podržavaju pozivanje funkcija (function-calling), strukturirani JSON izlaz i procesiranje dugog sadržaja s prozorom konteksta do 128 tisuća tokena za manje, odnosno 256 tisuća tokena za veće modele. Uz rad s tekstom, modeli podržavaju analizu slika i videa, a manje verzije imaju i ugrađenu podršku za glasovne ulaze.
Zašto je to važno
Prelazak na potpuno otvorenu Apache 2.0 licencu predstavlja prekretnicu jer omogućuje pojedincima i tvrtkama komercijalnu upotrebu, uz potpunu kontrolu nad vlastitim sustavima, podacima i arhitekturom. Modeli s podrškom za složene agentne tokove rada značajno smanjuju hardverske barijere, dopuštajući lokalno pokretanje napredne umjetne inteligencije bez oslanjanja na vanjske cloud usluge i skupe API pozive.
Tehnička pozadina
Nova linija otvorenih modela izgrađena je na istim temeljnim istraživanjima kao i naprednija Gemini 3 serija, no posebno je prilagođena za učinkovitost pri lokalnom izvođenju.
- Mobilni E2B i E4B modeli aktiviraju samo 2, odnosno 4 milijarde parametara tijekom rada kako bi maksimalno sačuvali memoriju i trajanje baterije na edge uređajima.
- 26B MoE model koristi arhitekturu mješavine stručnjaka (Mixture of Experts), pri čemu aktivira samo 3,8 milijardi parametara po tokenu, osiguravajući iznimno brze odgovore uz nisku latenciju.
- 31B Dense model maksimizira sirovu kvalitetu generiranja i služi kao moćan temelj koji programeri mogu fino podešavati (fine-tuning) za svoje specifične primjene.
Širi kontekst
S ovim modelima, Google snažno pojačava pritisak na tržištu modela otvorenog koda, izravno konkurirajući alternativama poput Metine Llame i francuskog Mistrala. Izvorna podrška za više od 140 jezika i snažne multimodalne sposobnosti čine Gemmu 4 izvrsnim alatom za globalnu upotrebu. Suradnja s proizvođačima hardvera osigurava da se manji modeli glatko izvode čak i na slabijim platformama, čime se umjetna inteligencija dodatno demokratizira.
Što slijedi
Težine (weights) novih Gemma 4 modela već su objavljene i mogu se trenutno preuzeti putem popularnih platformi kao što su Hugging Face, Kaggle i Ollama. U mjesecima koji dolaze, očekuje se ubrzan rast broja aplikacija, posebno u sferama mobilnih asistenata i lokalnih programerskih alata koji poštuju privatnost korisnika oslanjajući se na obradu na samom uređaju.
Izvor: Google DeepMind Objavljeno na portalu Umjetna Inteligencija Blog by ShtefAI, autor: Shtef



