Salta al contenuto principale

TUTTO ciò che devi sapere su Gemma 3

gemma_3

Buone notizie per gli sviluppatori: Google ha lanciato Gemma 3, una nuova famiglia di modelli AI "open-source" per ora la più potente soluzione AI eseguibile su una singola GPU.  L'obiettivo di Google è permettere agli sviluppatori di creare applicazioni AI in grado di funzionare su qualsiasi dispositivo.

Cos'è Gemma 3 e perché è importante

Gemma 3 - frutto della stessa tecnologia deitro a Gemini - segna il primo anniversario della famiglia di modelli Gemma (circa un anno fa venivano pubblicati Gemma 2 e Gemma 7B), che in soli 12 mesi ha raggiunto il traguardo di oltre 100 milioni di download e ha ispirato la creazione di più di 60.000 varianti da parte della community di sviluppatori, come riportato nel blog di Google.

La caratteristica principale di Gemma 3 è la sua capacità di funzionare efficacemente su una singola GPU o TPU (Tensor Processing Unit), offrendo prestazioni che - secondo Google - superano sul benchmark LMArena concorrenti che necessitano di molte più GPU (fino a 32), come Llama3-405B di Meta, DeepSeek-V3 e o3-mini.

Puoi approfondire le caratteristiche di Gemma 3 nel lungo report tecnico pubblicato da Google

GoogleFonte: Google

"Gemma 3 delivers state-of-the-art performance for its size, outperforming Llama3-405B, DeepSeek-V3 and o3-mini in preliminary human preference evaluations on LMArena's leaderboard."

Dimensioni e varietà dei modelli

Gemma 3 è disponibile in diverse dimensioni per adattarsi a varie esigenze hardware e di prestazioni:

  • 1B
  • 4B
  • 12B
  • 27B

Caratteristiche di Gemma 3

🌍Supporto multilingue 

Gemma 3 offre un supporto nativo per oltre 35 lingue e supporto pre-addestrato per più di 140 lingue, consentendo agli sviluppatori di creare applicazioni che possono comunicare nella lingua dei loro utenti a livello globale.

🎭Multimodalità

Gemma 3 può analizzare testi, immagini e brevi video. I modelli 4B, 12B e 27B supportano la visione, come specificato nel documento ufficiale.

🛤️Ampia finestra di contesto

Gemma 3 ha una finestra di contesto di 128.000 token, permettendo alle applicazioni di processare e comprendere grandi quantità di informazioni contemporaneamente.

🔧Function Calling e Output Strutturato

Il modello supporta il function calling (la funzione che dà a Gemma 3 la capacità di "premere pulsanti" in un programma) e output strutturato (grazie a cui l'AI può fornire risposte in formati predefiniti come JSON, XML, tabelle). Le due funzionalità aiutano ad automatizzare task e costruire esperienze "agentiche"

⚡Modelli quantizzati

Gemma 3 ha varie versioni quantizzate ufficiali, cioè versioni "compresse" del modello originale che  usano meno memoria e potenza di calcolo e sono quindi più efficienti su dispositivi con risorse limitate


ShieldGemma 2: un dispositivo di sicurezza integrato 

Insieme a Gemma 3, Google ha lanciato ShieldGemma 2, un checker di sicurezza per immagini. Questo strumento fornisce una soluzione pronta all'uso per la sicurezza delle immagini, producendo etichette di sicurezza in tre categorie:

  • Contenuti pericolosi
  • Contenuti sessualmente espliciti
  • Violenza

ShieldGemma 2 è progettato per essere personalizzabile in base alle specifiche esigenze di sicurezza degli sviluppatori e degli utenti, sfruttando l'architettura di Gemma 3 per promuovere uno sviluppo responsabile dell'AI.

Integrazione e accessibilità

Google ha reso Gemma 3 facilmente integrabile in vari flussi di lavoro esistenti, tra cui:

  • Framework popolari: Hugging Face Transformers, Ollama, JAX, Keras, PyTorch, Google AI Edge, UnSloth, vLLM e Gemma.cpp
  • Sperimentazione immediata: accesso istantaneo attraverso Google AI Studio, Kaggle o Hugging Face
  • Personalizzazione: include una codebase rinnovata con ricette per fine-tuning ed inferenza efficienti
  • Opzioni di deployment flessibili: Vertex AI, Cloud Run, Google GenAI API, ambienti locali e altre piattaforme

Ottimizzazione per hardware diversi

Gemma 3 è stato ottimizzato per funzionare su diverse piattaforme hardware:

  • GPU NVIDIA: dal Jetson Nano ai più recenti chip Blackwell
  • Google Cloud TPU
  • GPU AMD tramite lo stack open-source ROCm™
  • CPU con Gemma.cpp

Il "Gemmaverse" e il programma accademico

Il lancio di Gemma 3 amplia ulteriormente il cosiddetto "Gemmaverse", l'ecosistema di modelli e strumenti creati dalla community. Alcuni esempi notevoli includono:

  • SEA-LION v3 di AI Singapore: abbatte le barriere linguistiche nel Sud-Est asiatico
  • BgGPT di INSAIT: un modello linguistico pionieristico focalizzato sulla lingua bulgara
  • OmniAudio di Nexa AI: dimostra il potenziale dell'AI on-device per l'elaborazione audio avanzata

Per supportare la ricerca accademica, Google ha lanciato il Programma Accademico Gemma 3, che offre ai ricercatori la possibilità di richiedere crediti Google Cloud (del valore di $10.000 per premio) per accelerare la loro ricerca basata su Gemma 3.

Responsabilità e sicurezza

Google ha sottolineato l'importanza dello sviluppo responsabile di modelli AI open. Lo sviluppo di Gemma 3 ha incluso:

  • Governance rigorosa dei dati
  • Allineamento con le politiche di sicurezza di Google attraverso fine-tuning
  • Valutazioni robuste tramite benchmark

Le prestazioni STEM avanzate di Gemma 3 hanno spinto Google a condurre valutazioni specifiche incentrate sul potenziale uso improprio nella creazione di sostanze dannose. I risultati indicano un livello di rischio basso.


Fonti:
Google
The Verge