AI vijesti3 min čitanja

Google predstavlja Gemma 4: Najinteligentniji otvoreni modeli do sada

Google je predstavio Gemma 4 obitelj otvorenih jezičnih modela, optimiziranih za složeno rasuđivanje i lokalno izvođenje pod Apache 2.0 licencom.

S

Autor

Shtef

Objavljeno

Ilustracija uz članak: Google predstavlja Gemma 4 otvorene modele

Google predstavlja Gemma 4: Nove i snažnije otvorene AI modele

Novi modeli donose napredne mogućnosti rasuđivanja pod Apache 2.0 licencom

Google je predstavio Gemma 4, novu generaciju svojih otvorenih jezičnih modela dizajniranih za napredno rasuđivanje i agentne zadatke. Modeli su dostupni pod popustljivom Apache 2.0 licencom i donose značajan skok u performansama s obzirom na broj parametara, što ih čini iznimno korisnima za programere i istraživače širom svijeta.

Ključni detalji

Google je izdao Gemma 4 obitelj u četiri različite verzije: Effective 2B (E2B) i Effective 4B (E4B) koje su optimizirane za mobilne uređaje, te veće 26B Mixture of Experts (MoE) i 31B Dense modele za složenije zadatke. Svi modeli iz ove obitelji nativno podržavaju pozivanje funkcija (function-calling), strukturirani JSON izlaz i procesiranje dugog sadržaja s prozorom konteksta do 128 tisuća tokena za manje, odnosno 256 tisuća tokena za veće modele. Uz rad s tekstom, modeli podržavaju analizu slika i videa, a manje verzije imaju i ugrađenu podršku za glasovne ulaze.

Zašto je to važno

Prelazak na potpuno otvorenu Apache 2.0 licencu predstavlja prekretnicu jer omogućuje pojedincima i tvrtkama komercijalnu upotrebu, uz potpunu kontrolu nad vlastitim sustavima, podacima i arhitekturom. Modeli s podrškom za složene agentne tokove rada značajno smanjuju hardverske barijere, dopuštajući lokalno pokretanje napredne umjetne inteligencije bez oslanjanja na vanjske cloud usluge i skupe API pozive.

Tehnička pozadina

Nova linija otvorenih modela izgrađena je na istim temeljnim istraživanjima kao i naprednija Gemini 3 serija, no posebno je prilagođena za učinkovitost pri lokalnom izvođenju.

  • Mobilni E2B i E4B modeli aktiviraju samo 2, odnosno 4 milijarde parametara tijekom rada kako bi maksimalno sačuvali memoriju i trajanje baterije na edge uređajima.
  • 26B MoE model koristi arhitekturu mješavine stručnjaka (Mixture of Experts), pri čemu aktivira samo 3,8 milijardi parametara po tokenu, osiguravajući iznimno brze odgovore uz nisku latenciju.
  • 31B Dense model maksimizira sirovu kvalitetu generiranja i služi kao moćan temelj koji programeri mogu fino podešavati (fine-tuning) za svoje specifične primjene.

Širi kontekst

S ovim modelima, Google snažno pojačava pritisak na tržištu modela otvorenog koda, izravno konkurirajući alternativama poput Metine Llame i francuskog Mistrala. Izvorna podrška za više od 140 jezika i snažne multimodalne sposobnosti čine Gemmu 4 izvrsnim alatom za globalnu upotrebu. Suradnja s proizvođačima hardvera osigurava da se manji modeli glatko izvode čak i na slabijim platformama, čime se umjetna inteligencija dodatno demokratizira.

Što slijedi

Težine (weights) novih Gemma 4 modela već su objavljene i mogu se trenutno preuzeti putem popularnih platformi kao što su Hugging Face, Kaggle i Ollama. U mjesecima koji dolaze, očekuje se ubrzan rast broja aplikacija, posebno u sferama mobilnih asistenata i lokalnih programerskih alata koji poštuju privatnost korisnika oslanjajući se na obradu na samom uređaju.


Izvor: Google DeepMind Objavljeno na portalu Umjetna Inteligencija Blog by ShtefAI, autor: Shtef

Povezano

Pročitajte i ovo

Još nekoliko objava koje šire kontekst oko tema, kompanija i AI trendova iz ove priče.

Ilustracija uz članak: Prava cijena AI koda: Jeftino pisanje, skupo čitanje
Analiza

Prava cijena AI koda: Jeftino pisanje, skupo čitanje

Alati za generiranje koda ubrzavaju početni razvoj, ali stvaraju nepregledne sustave koji dugoročno višestruko povećavaju troškove održavanja.

Ilustracija: Umjetna inteligencija neće zamijeniti prave softverske inženjere
Analiza

Umjetna inteligencija neće zamijeniti prave softverske inženjere

Pisanje koda zapravo je najlakši dio softverskog inženjerstva, a generativni AI alati ne mogu zamijeniti ljudsko razumijevanje poslovnog konteksta.

Microsoft Copilot logo uz tekst upozorenja
AI vijesti

Microsoft priznaje: Copilot služi samo za zabavu

Uvjeti korištenja otkrivaju stvarno stanje Microsoftovog AI alata. Tvrtka upozorava da se ne oslanjate na Copilot za važne savjete.