Google lansira Gemmu 4, svoj veliki ulog u otvorenoj i lokalnoj umjetnoj inteligenciji

  • Gemma 4 je obitelj od četiri otvorena AI modela temeljena na Gemini 3 tehnologiji, s veličinama parametara u rasponu od E2B do 31B.
  • Modeli kombiniraju visoku "parametarsku inteligenciju" s lokalnim izvršavanjem na mobilnim, rubnim i vlasničkim infrastrukturama, zahvaljujući kontekstualnim prozorima do 256 tisuća tokena.
  • Licenca Apache 2.0 omogućuje neograničenu komercijalnu upotrebu, jača digitalni suverenitet i olakšava implementaciju u reguliranim okruženjima u Europi.
  • Gemma 4 je multimodalna (tekst, slika, video i audio u malim modelima), podržava više od 140 jezika i dostupna je u Google AI Studiu, Hugging Faceu, Kaggleu i Ollami.

Gemma 4 AI model

Google je napravio važan korak u svojoj strategiji otvorena umjetna inteligencija S lansiranjem Gemme 4, nova obitelj modela ima za cilj kombinirati visoku razinu rasuđivanja s puno skromnijim hardverskim zahtjevima. Tvrtka predstavlja ovu generaciju kao ozbiljnu alternativu za one kojima je potrebno pokretati naprednu umjetnu inteligenciju na vlastitoj infrastrukturi, od mobilnih uređaja do podatkovnih centara.

Daleko od toga da je riječ o jednom modelu, Gemma 4 je kompletna serija od četiri otvorene varijanteOsmišljen za razvojne programere, tvrtke i javne subjekte koji žele veću kontrolu nad svojim podacima i implementacijama, prijedlog se posebno dobro uklapa u zahtjeve Digitalni suverenitet i usklađenost s propisima u Europigdje moć odlučivanja o tome gdje će se izvršavati i gdje će se podaci pohranjivati ​​postaje sve važnija.

Obitelj od četiri modela usmjerena na "inteligenciju temeljenu na parametrima"

Obitelj modela Gemma 4

Gemma 4 je izgrađena na istim tehnološkim temeljima kao Gemini 3Ali s jasnim ciljem: maksimizirati ono što Google naziva "inteligencija temeljena na parametrima"Umjesto da se natječe isključivo veličinom, tvrtka se hvali da je postigla razine performansi usporedive s mnogo većim sustavima u relativno kompaktnim modelima.

Obitelj se sastoji od četiri različite veličineEfektivno 2B (E2B), Efektivno 4B (E4B), model 26B s arhitekturom miješanih stručnjaka (MoE) i gusta varijanta 31B parametriPotonji se već nalazi u među 3 najbolja na Arena AI ljestvici za otvorene modele, nadmašujući alternative koje mu broj parametara množe s dvadeset, što je posebno relevantno za one koji žele smanjiti troškove GPU-a bez žrtvovanja kvalitete.

Model 26B Ministarstvo obrazovanja Optimiziran je za aktiviranje samo dijela svojih parametara (oko 3,8 milijardi) u zaključivanju, poboljšavajući brzinu generiranja tokena i energetsku učinkovitost. Nasuprot tome, verzija 31B gustoće Pozicioniran je kao preferirana opcija za zahtjevne zadatke finog podešavanja, složenu orkestraciju i intenzivnu upotrebu u poslovnim ili institucionalnim okruženjima.

Google naglašava da se, u smislu javnih testova, ove varijante izravno natječu s težim modelima drugih dobavljača, uključujući one kineskih proizvođača poput DeepSeeka ili Qwena, koji su posljednjih godina postali jaki u ekosustavu otvorenog koda. Gemma 4-in 31B model je naveden kao treći najbolji otvoreni model u Arena AI-u., dok se i 26B MoE visoko kotira.

Iz poslovne perspektive, taj odnos između veličine i učinka implicira manji troškovi hardvera, niža latencija i mogućnost pokretanja graničnih modela u jednom NVIDIA H100 80GB grafička karticaTo otvara vrata srednjim europskim tvrtkama da rade s naprednom umjetnom inteligencijom bez ulaganja u nesrazmjernu infrastrukturu.

Džepna umjetna inteligencija: mobilni uređaji, IoT i rubno računalstvo

Gemma 4 na mobilnim uređajima

Manji modeli, E2B i E4BIzričito su dizajnirani za rad na rubu mreže, tj. mobilni uređaji, IoT i lokalni hardverGoogle napominje da su ove varijante optimizirane za rad na Android pametni telefoni, Raspberry PiJetson Nano i drugi sustavi niske potrošnje energije, s vrlo niskom latencijom, pa čak i bez internetske veze.

U ovom segmentu, prioritet nije samo sirova snaga, već i sposobnost ponude multimodalne funkcije i brzi odgovor u okruženjima s ograničenim resursima. Gemma 4 edge modeli mogu podnijeti tekst, slike i video, a u slučaju E2B i E4B dodaju izvornu podršku za opremaTo omogućuje slučajeve upotrebe kao što su lokalni glasovni asistenti, prepoznavanje slike na terenu ili analiza videa u stvarnom vremenu bez potrebe za slanjem podataka u oblak.

Kontekstni prozor za ove lagane modele doseže Oznake 128.000To je dovoljno za obradu dugih dokumenata, opsežnih razgovora ili relevantnih isječaka koda u jednom promptu. Prema Googleu, ova kombinacija širokog konteksta i lokalnog izvršavanja pomaže u uklanjanju trenja. privatnost, povezivost i latencijaTo je vrlo relevantno za industrijske, zdravstvene ili obrazovne projekte u Europi, gdje ograničenja obrade podataka postaju sve stroža.

Iz perspektive proizvođača hardvera, Gemma 4 otvara vrata integraciji Napredna umjetna inteligencija izravno u potrošačke proizvodeOd pametnih telefona i tableta do medicinskih uređaja i industrijskih senzora, tvrtka je istaknula da su ovi modeli dizajnirani za rad s čipovima uobičajenih pružatelja usluga Android ekosustava, kao što su Qualcomm i MediaTek, što olakšava njihovo široko usvajanje.

Nadalje, arhitektura rubnih modela koristi tehnike kao što su Ugrađivanja po sloju (PLE) kako bi se maksimizirala učinkovitost korištenja parametara, omogućujući zaključivanje i razumijevanje konteksta uz puno niže računalne troškove nego što je to uobičajeno u modelima opće namjene.

Multimodalnost, agenti i napredna podrška za razvojne programere

Gemmine 4 multimodalne mogućnosti

Jedna od snaga Gemme 4 je njena jasna predanost agentski tijekovi radaModeli nisu ograničeni samo na generiranje teksta: oni se izvorno integriraju pozivanje funkcija, strukturirani JSON izlaz i sistemske instrukcijeTo omogućuje konstrukciju autonomnih agenata koji orkestriraju različite korake, pozivaju vanjske API-je i vraćaju rezultate u formatima koji se lako integriraju s poslovnim aplikacijama.

Google inzistira na tome da su svi modeli iz obitelji Gemma 4 dizajnirani kao visokorazinski zaključivačis konfigurabilnim načinima razmišljanja za prilagodbu dubine razmišljanja prema zadatku. To se prevodi u bolje rezultate u višefazno zaključivanje, generiranje izvanmrežnog koda i rješavanje složenih problema, ključni aspekti u korporativnim i javnim upravnim okruženjima gdje je potrebna pouzdanost.

U multimodalnoj ravnini, četiri modela mogu obraditi Tekst i slike s različitim rezolucijama i omjerima slike, dok varijante E2B i E4B proširuju taj kapacitet na video i audioOva kombinacija omogućuje, na primjer, sustave koji analiziraju dokumente s grafikom, videozapise industrijskog praćenja ili bogati edukativni sadržaj te generiraju kontekstualne odgovore u stvarnom vremenu.

Kontekstni prozor doseže 256.000 tokena u najvećim modelimaTo korisnicima omogućuje prijenos cijelih repozitorija koda, dugih pravnih ugovora ili velikih količina tehničke dokumentacije u jednom upitu. Za timove za podršku, savjetovanje ili IT reviziju, ovo olakšava automatizaciju zadataka koji su prije zahtijevali mnogo sati ručnog pregleda.

Što se tiče jezika, Gemma 4 izvorno podržava više od 140 jezikaZa Europu, a posebno za Španjolsku, to znači da se mogu razviti višejezična rješenja koja pokrivaju sve, od glavnih jezika EU-a do manje zastupljenih jezika, pomažući u ostvarivanju ciljeva pristupačnosti i uključivosti u javnim i privatnim uslugama.

Integracija oblaka, digitalni suverenitet i implementacija u Europi

Implementacija Gemme 4 nije ograničena na lokalni hardver. Google je integrirao ove modele u svoju ponudu u oblaku putem Vrh AI y Google Kubernetes Engine (GKE)što organizacijama omogućuje konfiguriranje namjenskih računalnih resursa i skaliranje inferencijskih opterećenja na zahtjev. Za regulirane europske sektore ovo se kombinira s opcijama za Suvereni oblak i implementacije s odvojenim prostorom ili na lokaciji korisnika, prilagođene zahtjevima za smještaj podataka i usklađenosti s Općom uredbom o zaštiti podataka (GDPR).

Tvrtka ističe da se precizne utege bfloat16 većih modela mogu učinkovito koristiti u jedna NVIDIA H100 grafička kartica od 80 GBsmanjenje prepreka za ulazak za srednje velike tvrtke ili javne institucije koje žele zadržati kontrolu nad svojom infrastrukturom. U kvantiziranim verzijama, modeli mogu raditi i u potrošački hardver ili radne stanice, proširujući raspon mogućih implementacija.

Za tehnološke menadžere u Španjolskoj i ostatku Europe, ova kombinacija otvoreni model, kontrolirano postavljanje i suverena podrška za oblak Omogućuje dizajn hibridnih arhitektura: dio inteligencije može se nalaziti u lokalnim podatkovnim centrima, dok se druga manje osjetljiva opterećenja izvode u javnom oblaku, a sve to uz održavanje zajedničke tehnološke baze.

Osim toga, Google nudi Komplet za razvoj agenta (ADK)Modularni okvir koji pojednostavljuje stvaranje, testiranje i implementaciju agenata temeljenih na Gemma 4. Također se oslanja na usluge kao što su Pokretanje u oblaku s NVIDIA RTX PRO 6000 GPU-ima (Blackwell) u serverless načinu rada, što omogućuje pokretanje pilot projekata visokog intenziteta bez potrebe za nabavom vlastite opreme od prvog dana.

U europskom kontekstu gdje se rasprava o umjetnoj inteligenciji obično vrti oko kontrole, transparentnosti i mogućnosti revizije, mogućnost Implementirajte otvorene modele pod Apacheom 2.0 u kontroliranim infrastrukturama Posebno je privlačan upravama, bankama, osiguravajućim društvima ili tvrtkama u zdravstvenom sektoru koje trebaju uskladiti inovacije sa strogim regulatornim okvirima.

Apache licenca 2.0, otvoreni ekosustav i podrška zajednici

Ako postoji jedan aspekt koji je izazvao poseban interes u zajednici, to je odluka o licenciranju Gemme 4 pod Apache 2.0Prethodne verzije Gemme koristile su prilagođene licence koje su postavljale pravna pitanja za komercijalne proizvode; sada, sa standardnom licencom otvorenog koda, Razvojni programeri i tvrtke mogu mijenjati, redistribuirati i monetizirati modele s puno manje trenja.

Ovo otvaranje dolazi u vrijeme kada Google pokušava ponovno zauzeti poziciju u ekosustavu otvorenih modelaOvo dolazi nakon razdoblja u kojem su alternative poput Metine Llame ili kineskih modela (DeepSeek, Qwen, GLM, Minimax) postigle stopu prihvaćanja. Utjecajni glasovi u sektoru, poput suosnivača Hugging Facea, opisali su ovaj potez kao "ogromnu prekretnicu" za lokalnu umjetnu inteligenciju, ističući da pravni timovi sada imaju puno jasniji okvir za odobravanje projekata temeljenih na Gemmi 4.

Ekosustav koji okružuje obitelj Gemma već je pokazivao snagu prije ove verzije. Google napominje da prethodne generacije premašuju... 400 milijuna preuzimanja i da je zajednica stvorila više od 100.000 varijante prilagođeno različitim jezicima i slučajevima upotrebe. Među najupečatljivijim primjerima su modeli specijalizirani za bugarski ili alate za istraživanje raka kao što su Cell2Sentence-Scale razvijen na Sveučilištu Yale.

S Gemma 4, tvrtka se nada da će se "Gemmaverse" još više proširiti, pozivajući... Europski startupi, sveučilišta i istraživački centri za stvaranje vlastitih izvedenica. Kombinacija permisivne licence i otvorenih utega omogućuje razvoj verzija usmjerenih na određene sektore, poput zdravstva, pravosuđa, Industrije 4.0 ili obrazovanja, koje se zatim mogu dijeliti ili prodavati bez previše ograničenja.

Za španjolske tvrtke ova situacija znači da je moguće izgraditi vlasnička rješenja na Gemmi 4 - poput internih asistenata, korporativnih tražilica ili naprednih analitičkih sustava - uz održavanje kontrole nad kodom, podacima i infrastrukturom, što se dobro uklapa u trend jačanja Europski tehnološki suverenitet.

Primjeri upotrebe: od startupa do velikih korporacija

Gemma 4 je predstavljena sa širokim rasponom potencijalne primjeneU poslovnom svijetu, modeli se mogu koristiti za stvaranje višejezični virtualni asistenti sposoban za obradu složenih upita putem naprednog zaključivanja ili za automatizaciju generiranja i pregleda koda u razvojnim timovima.

Veći modeli su usmjereni na zadatke kao što su orkestracija agenata, analiza velikih količina dokumentacijeTo uključuje generiranje tehničkih izvješća ili pomoć pravnim i odjelima za usklađenost. Kombinacija širokog konteksta i multimodalne podrške olakšava jednom agentu rad s ugovorima, e-poštom, grafikonima, slikama sustava za praćenje i audio snimkama, sve unutar istog tijeka rada.

U obrazovanju i javnom sektoru, mogućnost obrade teksta, slika, a u nekim slučajevima i videa i zvuka, omogućuje stvaranje platforme za podršku učenju koji generiraju sažetke, detaljna objašnjenja ili materijale prilagođene različitim razinama. Lokalna provedba također pomaže u poštivanju zahtjeva za privatnost pri radu s osjetljivim podacima maloljetnika ili ranjivih skupina.

U startup areni, Gemma 4 može biti temelj vertikalni proizvodi U fintechu, digitalnom zdravstvu, logistici ili B2B SaaS-u, zahvaljujući fleksibilnosti koju nudi Apache 2.0, timovi mogu fino podešavanje modela na vlastitim podacima, implementirati ga lokalno ili u oblaku te plasirati rezultat na tržište bez vezanja za stroge vlasničke licence.

Za Europu je posebno zanimljiva mogućnost razvoja lokalna AI rješenja koji poštuju nacionalne i zajedničke propise, na primjer, pohranjivanjem podataka u podatkovnim centrima smještenim na europskom teritoriju i držanjem modela pod izravnom kontrolom organizacije, što može biti ključno za projekte povezane s budućom Uredbom EU o umjetnoj inteligenciji.

Gdje i kako pristupiti Gemmi 4

Google je učinio Gemma 4 težine dostupnima putem raznih kanala kako bi olakšao njihovo usvajanje od strane programera i istraživača. Otvorene težine mogu se preuzeti s Zagrljeno lice y GitHub, dok je korištenje putem sučelja i API-ja dostupno u Google AI StudioIntegracije se također nude s OllamaDocker, Kaggle i alati poput LM Studija.

Prema navodima tvrtke, Gemma 4 može se pokrenuti lokalno na «milijarde Android uređaja» i na širokom rasponu hardvera: od Grafički procesori za prijenosna računala i radne stanice, sve do namjenskih akceleratora za razvojne programere. To je u skladu sa strategijom proširenja napredne umjetne inteligencije izvan velikih podatkovnih centara, na uređaje krajnjih korisnika i okruženja rubnog računalstva.

Za one koji žele započeti s brzim testovima, najizravnija opcija je korištenje Google AI Studio za modele 26B i 31B ili Google AI Edge galerija u slučaju varijanti E2B i E4B. Paralelno s tim, zajednice programera na platformama poput Hugging Facea već objavljuju prilagodbe i konfiguracije spremne za korištenje za različita okruženja.

U Španjolskoj i drugim europskim zemljama očekuje se da će lokalni integratori i pružatelji upravljanih usluga početi nuditi Rješenja po principu "ključ u ruke" temeljena na Gemmi 4, kombinirajući implementacije suverenih oblaka, podršku na španjolskom jeziku i prilagodbu specifičnim sektorskim propisima, poput onih o financijskim uslugama ili zdravstvu.

Sveukupno, lansiranje Gemme 4 pozicionira Google kao jednog od najrelevantnijih igrača u području otvoreni i lokalno izvršni AI modeli, u vrijeme kada europska industrija traži upravo alate koji kombiniraju visoke performanse, kontrolu nad podacima i jasne okvire licenciranja za izgradnju dugoročnih komercijalnih proizvoda.

više privatnosti na rubu umjetne inteligencije
Povezani članak:
Edge AI i privatnost: Moćna umjetna inteligencija bez otkrivanja vaših podataka