Granite

Aperto. Performante. Affidabile. Con licenza Apache 2.0. Crittograficamente firmato1. Certificazione ISO2.

Illustrazione di forme geometriche stratificate in un gradiente di colori
IBM Granite 4.1 è alla base di un'implementazione AI sicura e on-premise
Modelli leggeri e performanti, rilasciati con licenza Apache 2.0, progettati per workload aziendali
Scopri di più su Granite 4.1

Perché costruire con Granite?

Sviluppa e scala l'AI più velocemente con modelli personalizzabili e open source, ottimizzati per workload, efficienza dei costi e distribuzione flessibile.

Aperto
Open source in Apache 2.0, Granite garantisce la trasparenza, consentendo al contempo la completa personalizzazione e flessibilità di implementazione su qualsiasi infrastruttura.
Scarica i modelli
Performanti
I modelli di piccole dimensioni e ad alte prestazioni sono progettati per massimizzare l'efficienza e la scalabilità per le attività aziendali essenziali
Esamina i benchmark
Affidabile
Elimina il rischio di AI "black box" con trasparenza nei dati e nei processi di addestramento, funzionalità di rilevamento e misure di sicurezza integrati.
Maggiori informazioni
Presentazione di Granite 4.1
Modelli linguistici Granite 4.1

I nostri modelli densi e non pensanti più performanti di sempre. Competitivi rispetto ai modelli più ampi e pensati per varie attività aziendali, a una frazione del costo. 

Scarica i modelli linguistici
Modelli linguistici Granite 4.1

Piccoli ma potenti. Precisione di trascrizione leader del settore per accenti, domini e ambienti rumorosi. 

Scarica i modelli vocali
Modelli di visione Granite 4.1

Comprendi documenti, grafici e immagini con precisione di livello enterprise.

Scarica i modelli di visione
Modelli Granite 4.1 Guardian

Guardrail per rilevare contenuti e output dannosi. Costruiti per la conformità aziendale.

Scarica i modelli Guardian
Modelli di embedding Granite

Rappresentazioni semantiche accurate per il recupero, la ricerca e la classificazione.

Scarica modelli di embedding

Esplora i benchmark

Questi modelli sono stati valutati rispetto a un'ampia raccolta di set di dati e metriche che coprono diversi aspetti della generazione del testo. Vedi altri benchmark nel blog tecnico di Granite.​

 

Benchmark​Metricagranite-4.1-3b​granite-4.1-8b​granite-4.1-30b​
MMLU​5-shot​67.02​73.84​80.16​
IFEval Avg​ 82.3​87.06​89.65​
ArenaHard​ 37.8​68.98​71.02​
GSM8K​8-shot​86.88​92.49​94.16​
HumanEval​pass@1​79.27​87.2​89.63​
BFCL v3​ 60.8​68.27​73.68​
MMMLU​5-shot​57.61​64.84​73.71​
AttaQ​ 81.88​81.19​85.76​

Accedi e costruisci

Hugging Face

Vai a Hugging Face
Ollama

Vai a Ollama
LM Studio

Vai a LM Studio
watsonx.ai

Vai a watsonx
OpenRouter

Vai a OpenRouter
Replicate

Vai a Replicate
Weights & Biases

Vai a Weights & Biases
Unsloth

Vai a Unsloth
AnythingLLM

Vai a AnythingLLM

Prestazioni ed efficienza

Granite 4.1 offre prestazioni competitive nel seguire le istruzioni e nel chiamare gli strumenti senza affidarsi a lunghe chain of thought, offrendo una latenza prevedibile, un utilizzo stabile dei token e un costo operativo inferiore. Questo lo rende una scelta solida e pronta per la produzione, ideale per i workload aziendali in cui efficienza e affidabilità sono fondamentali.

I modelli linguistici di Granite 4.1 comprendono ed eseguono istruzioni basate su strumenti, consentendo una perfetta integrazione con diversi strumenti software e API. Questa funzionalità permette alle aziende di creare potenti workflow basati sull'AI, automatizzando al contempo le attività più complesse.

Grafico a barre orizzontali intitolato "I modelli linguistici di Granite 4.1 offrono funzionalità superiori di chiamata degli strumenti", basato sui punteggi del benchmark BFCL V3 (un punteggio più alto indica le prestazioni migliori). Granite-4.1-30B è al primo posto con 73,7, seguito da Gemma-4-31B-it con 72,7 e Granite-4,1-8B al 68,3. I modelli rimanenti ottengono un punteggio compreso tra circa 61,7 e 67,8, incluso Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61.9) e Qwen3.5-9B (61,7). I modelli Granite 4.1 sono evidenziati in blu e superano gli altri.

I modelli linguistici Granite 4.1 comprendono e seguono le istruzioni dell'utente, garantendo un completamento affidabile e accurato delle attività. Questa funzionalità è particolarmente utile per le aziende che desiderano automatizzare i processi e fornire risultati coerenti e di alta qualità.

Grafico a barre orizzontali intitolato "I modelli linguistici Granite 4.1 offrono funzionalità competitive per seguire le istruzioni", basato sui risultati IFEval. Gemma-4-31B-it è al primo posto con 94,1, seguito da Gemma-4-26B-A4B-it con 91,3. Granite-4.1-30B ha ottenuto un punteggio di 89,7, con prestazioni leggermente superiori a Qwen3,5-35B-A3B a 89,1 e davanti a diversi modelli raggruppati tra circa 85 e 88, tra cui Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen3.5-9B (87,2) e Granite-4.1-8B (87,1). I punteggi più bassi includono Granite-4.1-3B a 82,1 e Qwen3,5-2B a 70,6. I modelli Granite 4.1 sono evidenziati in blu, mostrando prestazioni competitive ma non ottimali rispetto ai modelli Gemma.

Granite Guardian 4.1 rileva le principali dimensioni di rischio catalogate nell'IBM AI Risk Atlas. Addestrato su dati unici comprendenti annotazioni umane e dati sintetici provenienti dal red-teaming interno, Guardian supera modelli simili su benchmark standard (inclusi, a titolo di esempio, tentativi di jailbreak, linguaggio volgare e allucinazioni relative a chiamate di strumenti e retrieval-augmented generation nei sistemi basati su agenti ).

Tabella che confronta le prestazioni dei modelli tra i set di dati di valutazione, con colonne per Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B e una baseline Oracle. Granite-Guardian-4.1-8B (evidenziato) ottiene risultati solidi su tutti i set di dati: GSM8k (93,71), MATH (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70), e IFEval (82,81), con un punteggio complessivo di 70,29. Supera leggermente gli altri modelli nella maggior parte delle categorie, mentre i punteggi Oracle rimangono più alti complessivamente, di cui 97,46 su GSM8k e 81,54 in generale.

Granite Speech 4.1 offre un riconoscimento vocale estremamente accurato e pronto per le aziende in diversi ambienti audio del mondo reale, ottenendo bassi tassi di errore nelle parole per i benchmark che comprendono il parlato conversazionale, le riunioni, le presentazioni e le chiamate.

Grafico a barre raggruppato intitolato "Granite Speech 4.1 supera la concorrenza nella precisione delle trascrizioni", che mostra i tassi di errore delle parole ASR in inglese su nove set di dati (il punteggio più basso indica le prestazioni migliori): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM e Earnings -22. Vengono confrontati diversi modelli, tra cui Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary e le varianti Granite Speech (in azzurro chiaro). I modelli Granite Speech raggiungono costantemente i tassi di errore più bassi nella maggior parte dei set di dati. I tassi di errore variano da circa 1–2 su LScln, 3–5 su LSoth e SPGI, circa 9–16 su AMI_IHM e il più alto su AMI_SDM (circa 22–41). Il grafico evidenzia che Granite Speech 4.1 offre la migliore precisione di trascrizione complessiva rispetto ai modelli concorrenti.

Granite Vision 4.1 offre prestazioni leader di settore nell'estrazione di informazioni strutturate da contenuti visivi, raggiungendo il punteggio medio più alto in sette benchmark che spaziano dall'estrazione grafica all'estrazione di tabelle, fino all'estrazione di coppie chiave-valore (KVP).

Grafico a barre orizzontali intitolato "Granite Vision 4.1 supera Claude Opus 4.6 nell'estrazione di tabelle", che mostra i punteggi medi in sette benchmark di estrazione (un punteggio più alto indica prestazioni migliori). Granite-Vision-4.1-4B si classifica al primo posto con un punteggio di 86,5, seguito da Claude-Opus-4.6 con 83,8. Altri modelli hanno ottenuto punteggi più bassi: Gemma4-E4B (72,4), Qwen3,5-4B (71,7), Ministral-3-8B (68,2) e InternVL3.5-4B (66,4). Granite Vision è evidenziato in blu, Claude in viola e i restanti modelli in grigio, sottolineando come Granite Vision sia il modello con le prestazioni migliori.

Scelto dalle aziende di tutti i settori

US Open

Gli US Open volevano coinvolgere i fan di tutto il mondo con esperienze digitali in continua evoluzione. IBM ha contribuito a trasformare i dati di enormi partite in insight basati sull'AI e caratteristiche interattive, offrendo un'esperienza dinamica di app e siti web che mantiene i fan connessi e immersi in ogni momento.

14 milioni
milioni di fan in tutto il mondo che partecipano a esperienze digitali di livello mondiale
7 mln
punti dati acquisiti e analizzati durante il torneo
Grandangolo dello stadio degli US Open con i tifosi che guardano una partita

Granite per sviluppatori

Ricetta: sintesi di documenti

Crea uno strumento per il riepilogo di documenti con IBM Granite per elaborare documenti oltre i limiti della finestra di contesto.

RAG con Langchain

Crea una pipeline RAG con Granite per rispondere alle query utilizzando una knowledge base esterna.

Ricetta: RAG multimodale

Crea una pipeline RAG multimodale con Granite e Docling per interrogare testo, tabelle e immagini.

Guida: modelli open source

Scopri come gli LLM open source consentono autonomia, riducono i costi e aiutano gli sviluppatori con la valutazione, la regolazione e la distribuzione.

Tutorial: forecasting delle serie temporali

Utilizza i modelli di serie temporali Granite per eseguire il forecasting zero-shot e fine-tuned.

Granite Agent Cookbook

Ricette Granite per attività agentiche.

Tutorial: co-pilot di AI locale

Costruisci un co-pilot di AI locale utilizzando IBM Granite Code, Ollama e Continue.

Granite Cookbook

Visualizza il Granite Cookbook completo

Costruisci con Granite

I modelli Granite guidano l'AI alla base di molti prodotti e servizi IBM. Scopri soluzioni pronte all'uso per la generazione di codice, lo sviluppo di applicazioni e il test dei modelli. Il tutto supportato da IBM Granite.

Agente di AI Coding

Velocizza la codifica e semplifica lo sviluppo con AI e automazione grazie ai modelli Granite.

Scopri l'agente di AI Coding
watsonx.ai

Crea e implementa applicazioni AI utilizzando modelli Granite o scegli tra una varietà di modelli di terze parti.

Esplora watsonx.ai
watsonx Orchestrate

Sviluppa e gestisci agenti AI basati su Granite ed esplora il catalogo di agenti precostituiti.

Scopri watsonx Orchestrate
Red Hat Enterprise Linux AI

Sviluppa, testa ed esegui gli LLM, incluso Granite.

Esplora Red Hat Enterprise Linux AI

IBM si impegna a creare, distribuire e utilizzare modelli AI che stimolano l'innovazione in tutta l'azienda in modo responsabile. La piattaforma dati e AI IBM watsonx dispone di un processo end-to-end per la creazione e il test dell'AI generativa e dei foundation model. Per i modelli sviluppati da IBM, cerchiamo ed eliminiamo duplicati e utilizziamo liste di blocco degli URL, filtri per contenuti discutibili e qualità dei documenti, tecniche di suddivisione delle frasi e di tokenizzazione, il tutto prima di un modello di formazione.

Durante il processo di addestramento dei dati, lavoriamo per evitare disallineamenti nei risultati dei modelli e utilizziamo la messa a punto supervisionata per migliorare il seguito delle istruzioni in modo che il modello possa essere utilizzato per completare le attività aziendali attraverso l'ingegneria dei prompt. Continuiamo a sviluppare modelli Granite in diverse direzioni, tra cui altre modalità, contenuti specifici di settore e più annotazioni di dati per la formazione, implementando al contempo misure di protezione dei dati periodica e in corso per i modelli sviluppati da IBM. 

Data la rapida evoluzione della tecnologia AI generativa, dobbiamo continuare a sviluppare e migliorare i nostri processi end-to-end. A testimonianza del rigore con cui sviluppa e testa i suoi foundation model, IBM offre da contratto un indennizzo standard per la proprietà intellettuale per tutti i modelli da essa sviluppati, così come per i suoi prodotti hardware e software.

Inoltre, in linea con l'approccio IBM e contrariamente ad altri fornitori di modelli linguistici di grandi dimensioni, IBM non richiede ai suoi clienti un indennizzo per l'utilizzo dei modelli sviluppati da IBM da un cliente. Inoltre, in linea con l'approccio IBM al proprio obbligo di indennizzo, IBM non limita la propria responsabilità di indennizzo per i modelli sviluppati da IBM.

I modelli watsonx che beneficiano di questo indennizzo includono al momento:

(1) Famiglia Slate di modelli solo encoder.

(2) Famiglia Granite di un modello solo decoder.

Scopri di più sulle licenze per i modelli Granite

1A partire dal 29 aprile 2026, i modelli linguistici, di visione, discorso, embedding e Guardian rilasciati sono firmati crittograficamente.

2Certificazione ISO riguardante il Granite AI Management System (AIMS) dei modelli linguistici Granite. Il certificato può essere trovato qui: https://www.schellman.com/certificate-directory al numero 1102257-1.