Granite | IBM

Illustrazione di forme geometriche stratificate in un gradiente di colori

IBM Granite 4.1 è alla base di un'implementazione AI sicura e on-premise

Modelli leggeri e performanti, rilasciati con licenza Apache 2.0, progettati per workload aziendali

Perché costruire con Granite?

Sviluppa e scala l'AI più velocemente con modelli personalizzabili e open source, ottimizzati per workload, efficienza dei costi e distribuzione flessibile.

Aperto

Open source in Apache 2.0, Granite garantisce la trasparenza, consentendo al contempo la completa personalizzazione e flessibilità di implementazione su qualsiasi infrastruttura.

Scarica i modelli

Performanti

I modelli di piccole dimensioni e ad alte prestazioni sono progettati per massimizzare l'efficienza e la scalabilità per le attività aziendali essenziali

Esamina i benchmark

Affidabile

Elimina il rischio di AI "black box" con trasparenza nei dati e nei processi di addestramento, funzionalità di rilevamento e misure di sicurezza integrati.

Maggiori informazioni

Presentazione di Granite 4.1

Modelli linguistici Granite 4.1

I nostri modelli densi e non pensanti più performanti di sempre. Competitivi rispetto ai modelli più ampi e pensati per varie attività aziendali, a una frazione del costo.

Scarica i modelli linguistici

Modelli linguistici Granite 4.1

Piccoli ma potenti. Precisione di trascrizione leader del settore per accenti, domini e ambienti rumorosi.

Scarica i modelli vocali

Modelli di visione Granite 4.1

Comprendi documenti, grafici e immagini con precisione di livello enterprise.

Scarica i modelli di visione

Modelli Granite 4.1 Guardian

Guardrail per rilevare contenuti e output dannosi. Costruiti per la conformità aziendale.

Scarica i modelli Guardian

Modelli di embedding Granite

Rappresentazioni semantiche accurate per il recupero, la ricerca e la classificazione.

Scarica modelli di embedding

Esplora i benchmark

Questi modelli sono stati valutati rispetto a un'ampia raccolta di set di dati e metriche che coprono diversi aspetti della generazione del testo. Vedi altri benchmark nel blog tecnico di Granite.

Benchmark	Metrica	granite-4.1-3b	granite-4.1-8b	granite-4.1-30b
MMLU	5-shot	67.02	73.84	80.16
IFEval Avg		82.3	87.06	89.65
ArenaHard		37.8	68.98	71.02
GSM8K	8-shot	86.88	92.49	94.16
HumanEval	pass@1	79.27	87.2	89.63
BFCL v3		60.8	68.27	73.68
MMMLU	5-shot	57.61	64.84	73.71
AttaQ		81.88	81.19	85.76

Accedi e costruisci

Hugging Face

Ollama

LM Studio

watsonx.ai

OpenRouter

Replicate

Weights & Biases

Vai a Weights & Biases

Unsloth

Vai a Unsloth

AnythingLLM

Vai a AnythingLLM

Prestazioni ed efficienza

Granite 4.1 offre prestazioni competitive nel seguire le istruzioni e nel chiamare gli strumenti senza affidarsi a lunghe chain of thought, offrendo una latenza prevedibile, un utilizzo stabile dei token e un costo operativo inferiore. Questo lo rende una scelta solida e pronta per la produzione, ideale per i workload aziendali in cui efficienza e affidabilità sono fondamentali.

Tool calling
Seguono le istruzioni
Rilevamento dei danni
Precisione della trascrizione
Estrazione di tabelle e grafici

I modelli linguistici di Granite 4.1 comprendono ed eseguono istruzioni basate su strumenti, consentendo una perfetta integrazione con diversi strumenti software e API. Questa funzionalità permette alle aziende di creare potenti workflow basati sull'AI, automatizzando al contempo le attività più complesse.

Grafico a barre orizzontali intitolato "I modelli linguistici di Granite 4.1 offrono funzionalità superiori di chiamata degli strumenti", basato sui punteggi del benchmark BFCL V3 (un punteggio più alto indica le prestazioni migliori). Granite-4.1-30B è al primo posto con 73,7, seguito da Gemma-4-31B-it con 72,7 e Granite-4,1-8B al 68,3. I modelli rimanenti ottengono un punteggio compreso tra circa 61,7 e 67,8, incluso Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61.9) e Qwen3.5-9B (61,7). I modelli Granite 4.1 sono evidenziati in blu e superano gli altri.

I modelli linguistici Granite 4.1 comprendono e seguono le istruzioni dell'utente, garantendo un completamento affidabile e accurato delle attività. Questa funzionalità è particolarmente utile per le aziende che desiderano automatizzare i processi e fornire risultati coerenti e di alta qualità.

Grafico a barre orizzontali intitolato "I modelli linguistici Granite 4.1 offrono funzionalità competitive per seguire le istruzioni", basato sui risultati IFEval. Gemma-4-31B-it è al primo posto con 94,1, seguito da Gemma-4-26B-A4B-it con 91,3. Granite-4.1-30B ha ottenuto un punteggio di 89,7, con prestazioni leggermente superiori a Qwen3,5-35B-A3B a 89,1 e davanti a diversi modelli raggruppati tra circa 85 e 88, tra cui Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen3.5-9B (87,2) e Granite-4.1-8B (87,1). I punteggi più bassi includono Granite-4.1-3B a 82,1 e Qwen3,5-2B a 70,6. I modelli Granite 4.1 sono evidenziati in blu, mostrando prestazioni competitive ma non ottimali rispetto ai modelli Gemma.

Granite Guardian 4.1 rileva le principali dimensioni di rischio catalogate nell'IBM AI Risk Atlas. Addestrato su dati unici comprendenti annotazioni umane e dati sintetici provenienti dal red-teaming interno, Guardian supera modelli simili su benchmark standard (inclusi, a titolo di esempio, tentativi di jailbreak, linguaggio volgare e allucinazioni relative a chiamate di strumenti e retrieval-augmented generation nei sistemi basati su agenti ).

Tabella che confronta le prestazioni dei modelli tra i set di dati di valutazione, con colonne per Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B e una baseline Oracle. Granite-Guardian-4.1-8B (evidenziato) ottiene risultati solidi su tutti i set di dati: GSM8k (93,71), MATH (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70), e IFEval (82,81), con un punteggio complessivo di 70,29. Supera leggermente gli altri modelli nella maggior parte delle categorie, mentre i punteggi Oracle rimangono più alti complessivamente, di cui 97,46 su GSM8k e 81,54 in generale.

Granite Speech 4.1 offre un riconoscimento vocale estremamente accurato e pronto per le aziende in diversi ambienti audio del mondo reale, ottenendo bassi tassi di errore nelle parole per i benchmark che comprendono il parlato conversazionale, le riunioni, le presentazioni e le chiamate.

Grafico a barre raggruppato intitolato "Granite Speech 4.1 supera la concorrenza nella precisione delle trascrizioni", che mostra i tassi di errore delle parole ASR in inglese su nove set di dati (il punteggio più basso indica le prestazioni migliori): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM e Earnings -22. Vengono confrontati diversi modelli, tra cui Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary e le varianti Granite Speech (in azzurro chiaro). I modelli Granite Speech raggiungono costantemente i tassi di errore più bassi nella maggior parte dei set di dati. I tassi di errore variano da circa 1–2 su LScln, 3–5 su LSoth e SPGI, circa 9–16 su AMI_IHM e il più alto su AMI_SDM (circa 22–41). Il grafico evidenzia che Granite Speech 4.1 offre la migliore precisione di trascrizione complessiva rispetto ai modelli concorrenti.

Granite Vision 4.1 offre prestazioni leader di settore nell'estrazione di informazioni strutturate da contenuti visivi, raggiungendo il punteggio medio più alto in sette benchmark che spaziano dall'estrazione grafica all'estrazione di tabelle, fino all'estrazione di coppie chiave-valore (KVP).

Grafico a barre orizzontali intitolato "Granite Vision 4.1 supera Claude Opus 4.6 nell'estrazione di tabelle", che mostra i punteggi medi in sette benchmark di estrazione (un punteggio più alto indica prestazioni migliori). Granite-Vision-4.1-4B si classifica al primo posto con un punteggio di 86,5, seguito da Claude-Opus-4.6 con 83,8. Altri modelli hanno ottenuto punteggi più bassi: Gemma4-E4B (72,4), Qwen3,5-4B (71,7), Ministral-3-8B (68,2) e InternVL3.5-4B (66,4). Granite Vision è evidenziato in blu, Claude in viola e i restanti modelli in grigio, sottolineando come Granite Vision sia il modello con le prestazioni migliori.

Scelto dalle aziende di tutti i settori

US Open

Gli US Open volevano coinvolgere i fan di tutto il mondo con esperienze digitali in continua evoluzione. IBM ha contribuito a trasformare i dati di enormi partite in insight basati sull'AI e caratteristiche interattive, offrendo un'esperienza dinamica di app e siti web che mantiene i fan connessi e immersi in ogni momento.

14 milioni

milioni di fan in tutto il mondo che partecipano a esperienze digitali di livello mondiale

7 mln

punti dati acquisiti e analizzati durante il torneo

Leggi lo studio

Scuderia Ferrari HP

Scuderia Ferrari voleva evolvere la propria esperienza digitale per coinvolgere meglio una fanbase globale. IBM ha contribuito a trasformare vasti dati di corse in insight basati sull'AI e contenuti personalizzati, offrendo un'app reinventata che avvicina i fan all'azione con caratteristiche interattive e narrazioni immersive.

Leggi lo studio

Blue Pearl

Blue Pearl voleva rendere i propri processi di selezione più rapidi ed efficienti. IBM ha contribuito a trasformare i workflow grazie all'abbinamento dei lavori basato sull'AI e alla creazione automatizzata dei contenuti, connettendo candidati e datori di lavoro con maggiore precisione e velocità.

85%

riduzione del tempo medio per coprire i posti vacanti

97%

riduzione del tempo di screening

Leggi lo studio

Food Ladder

Food Ladder aveva bisogno di scalare la sua lotta contro l'insicurezza alimentare, supportando al contempo le comunità remote. IBM ha aiutato a portare l'automazione basata sull'AI e gli strumenti digitali per espandere la propria portata, offrendo una piattaforma più intelligente che abilita una produzione alimentare sostenibile ed esperienze di apprendimento personalizzate in tutto il mondo.

85.000

pasti integrati da un magazzino

25 milioni

Obiettivo di un milione di pasti nel 2030, in aumento rispetto ai 132.480 pasti del 2024.

Leggi lo studio

Granite per sviluppatori

Ricetta: sintesi di documenti

Crea uno strumento per il riepilogo di documenti con IBM Granite per elaborare documenti oltre i limiti della finestra di contesto.

RAG con Langchain

Crea una pipeline RAG con Granite per rispondere alle query utilizzando una knowledge base esterna.

Ricetta: RAG multimodale

Crea una pipeline RAG multimodale con Granite e Docling per interrogare testo, tabelle e immagini.

Guida: modelli open source

Scopri come gli LLM open source consentono autonomia, riducono i costi e aiutano gli sviluppatori con la valutazione, la regolazione e la distribuzione.

Tutorial: forecasting delle serie temporali

Utilizza i modelli di serie temporali Granite per eseguire il forecasting zero-shot e fine-tuned.

Granite Agent Cookbook

Ricette Granite per attività agentiche.

Tutorial: co-pilot di AI locale

Costruisci un co-pilot di AI locale utilizzando IBM Granite Code, Ollama e Continue.

Granite Cookbook

Visualizza il Granite Cookbook completo

Costruisci con Granite

I modelli Granite guidano l'AI alla base di molti prodotti e servizi IBM. Scopri soluzioni pronte all'uso per la generazione di codice, lo sviluppo di applicazioni e il test dei modelli. Il tutto supportato da IBM Granite.

Agente di AI Coding

Velocizza la codifica e semplifica lo sviluppo con AI e automazione grazie ai modelli Granite.

Scopri l'agente di AI Coding

watsonx.ai

Crea e implementa applicazioni AI utilizzando modelli Granite o scegli tra una varietà di modelli di terze parti.

Esplora watsonx.ai

watsonx Orchestrate

Sviluppa e gestisci agenti AI basati su Granite ed esplora il catalogo di agenti precostituiti.

Scopri watsonx Orchestrate

Red Hat Enterprise Linux AI

Sviluppa, testa ed esegui gli LLM, incluso Granite.

Esplora Red Hat Enterprise Linux AI

Analisti e classifiche

IBM è stata nominata leader in data science e machine learning.

Leggi il report per scoprire come IBM consente ai data scientist e agli ingegneri di machine learning di costruire, implementare e gestire applicazioni di AI di grande impatto nelle loro aziende.

GuardBench Leaderboard for Guardrail Models

Scopri perché i modelli Granite Guardian si posizionano in sei dei primi 10 posti della classifica di GuardBench, eccellendo nell'identificazione di prompt dannosi o maligni e di risposte generate da LLM.

Speech Recognition Open ASR Leaderboard

Esplora la classifica in cui IBM è classificata come i migliori modelli vocali in base al basso tasso di errore delle parole.

Indice di Trasparenza di Stanford

Esplora perché Granite ha ottenuto il punteggio massimo nello Stanford Foundation Model Transparency Index, che valuta l'apertura sulle fonti di dati, le dimensioni dei set di dati, il filtro dei contenuti dannosi e altri fattori chiave di trasparenza.

Prossimi passi

IBM si impegna a creare, distribuire e utilizzare modelli AI che stimolano l'innovazione in tutta l'azienda in modo responsabile. La piattaforma dati e AI IBM watsonx dispone di un processo end-to-end per la creazione e il test dell'AI generativa e dei foundation model. Per i modelli sviluppati da IBM, cerchiamo ed eliminiamo duplicati e utilizziamo liste di blocco degli URL, filtri per contenuti discutibili e qualità dei documenti, tecniche di suddivisione delle frasi e di tokenizzazione, il tutto prima di un modello di formazione.

Durante il processo di addestramento dei dati, lavoriamo per evitare disallineamenti nei risultati dei modelli e utilizziamo la messa a punto supervisionata per migliorare il seguito delle istruzioni in modo che il modello possa essere utilizzato per completare le attività aziendali attraverso l'ingegneria dei prompt. Continuiamo a sviluppare modelli Granite in diverse direzioni, tra cui altre modalità, contenuti specifici di settore e più annotazioni di dati per la formazione, implementando al contempo misure di protezione dei dati periodica e in corso per i modelli sviluppati da IBM.

Data la rapida evoluzione della tecnologia AI generativa, dobbiamo continuare a sviluppare e migliorare i nostri processi end-to-end. A testimonianza del rigore con cui sviluppa e testa i suoi foundation model, IBM offre da contratto un indennizzo standard per la proprietà intellettuale per tutti i modelli da essa sviluppati, così come per i suoi prodotti hardware e software.

Inoltre, in linea con l'approccio IBM e contrariamente ad altri fornitori di modelli linguistici di grandi dimensioni, IBM non richiede ai suoi clienti un indennizzo per l'utilizzo dei modelli sviluppati da IBM da un cliente. Inoltre, in linea con l'approccio IBM al proprio obbligo di indennizzo, IBM non limita la propria responsabilità di indennizzo per i modelli sviluppati da IBM.

I modelli watsonx che beneficiano di questo indennizzo includono al momento:

(1) Famiglia Slate di modelli solo encoder.

(2) Famiglia Granite di un modello solo decoder.

Scopri di più sulle licenze per i modelli Granite

¹A partire dal 29 aprile 2026, i modelli linguistici, di visione, discorso, embedding e Guardian rilasciati sono firmati crittograficamente.

²Certificazione ISO riguardante il Granite AI Management System (AIMS) dei modelli linguistici Granite. Il certificato può essere trovato qui: https://www.schellman.com/certificate-directory al numero 1102257-1.