Home topics data mart Cos'è un data mart?
Scopri il data mart e come può migliorare l'efficienza del team, ridurre i costi e facilitare un processo decisionale aziendale tattico più intelligente
Sfondo blu e nero
Cos'è un data mart?

Un data mart è un sottoinsieme di un data warehouse focalizzato su una linea di business, un reparto o un'area tematica specifici. I data mart mettono a disposizione dei dati specifici per un gruppo definito di utenti, il che consente loro di accedere rapidamente ad insight critici senza dover perdere tempo a cercare in un intero data warehouse. Ad esempio, molte aziende possono avere data mart relativi a reparti specifici nell'azienda, come, ad esempio, quello finanziario, delle vendite o del marketing.

Confronto tra data mart, data warehouse e data lake

Data mart, data warehouse e data lake sono repository centralizzati di dati cruciali, ma soddisfano esigenze diverse all'interno di un'organizzazione.

Un data warehouse è un sistema che aggrega i dati da più fonti in un unico archivio dati centrale e coerente per supportare il data mining, l'AI e il machine learning, che, in definitiva, possono migliorare analisi e business intelligence sofisticate. Attraverso questo processo di raccolta strategico, le soluzioni di data warehouse consolidano i dati provenienti da diverse fonti per renderli disponibili in una forma unificata. 

Un data mart (come osservato in precedenza) è una versione mirata di un data warehouse che contiene un sottoinsieme più piccolo di dati importanti e necessari per un singolo team o un gruppo selezionato di utenti all'interno di un'organizzazione. Un data mart è creato da un data warehouse esistente (o altre fonti di dati) attraverso una procedura complessa che coinvolge più tecnologie e strumenti per progettare e costruire un database fisico, popolarlo con i dati e impostare intricati protocolli di accesso e gestione.

Nonostante sia un processo impegnativo, consente a una linea di business di scoprire insight di maggiore interesse più rapidamente che lavorando con l'insieme di dati più ampio di un data warehouse. Ad esempio, i team di marketing possono trarre vantaggio della creazione di un data mart da un warehouse esistente, dato che le sue attività sono di solito eseguite indipendentemente dal resto del business. Pertanto il team non ha bisogno di accedere a tutti i dati aziendali.

Anche un data lake è un repository di dati. Un data lake fornisce uno storage massiccio di dati non strutturati o non elaborati alimentati da più fonti, ma le informazioni ricavate non sono ancora elaborate o preparate per l'analisi. Essendo in grado di memorizzare i dati in un formato non elaborato, i data lake sono più accessibili e convenienti dei data warehouse. Non c'è bisogno di ripulire ed elaborare i dati prima dell'inserimento.

Ad esempio, i governi possono usare la tecnologia per tracciare i dati sul comportamento del traffico, sull'uso dell'energia e sui corsi d'acqua, e memorizzarli in un data lake finché non riescono a capire come utilizzare le informazioni per creare "città più intelligenti" con servizi più efficienti.

Vantaggi di un data mart

I data mart sono progettati per soddisfare le esigenze di gruppi specifici in quanto hanno un ambito di dati relativamente ristretto. E pur potendo comunque contenere milioni di record, un data mart ha l'obiettivo di fornire agli utenti aziendali i dati più rilevanti nel minor tempo possibile. 

Con la sua progettazione più piccola e mirata, un data mart offre agli utenti diversi vantaggi, tra cui:

  • Efficienza in termini di costi: durante l'impostazione di un data mart, è necessario considerare diversi fattori, come, ad esempio, l'ambito, le integrazioni e il processo per estrarre, trasformare e caricare (ETL, extract, transform, and load). Tuttavia, un data mart in genere incide solo per una frazione sul costo di un data warehouse.

  • Accesso semplificato ai dati: i data mart contengono solo un piccolo sottoinsieme di dati, quindi gli utenti possono recuperare rapidamente i dati di cui hanno bisogno con uno sforzo minore rispetto a quello richiesto quando lavorano con un insieme di più ampio da un data warehouse.

  • Accesso più rapido agli insight: l'intuizione ottenuta da un data warehouse supporta un processo decisionale strategico a livello aziendale, che ha un impatto sull'intera azienda. Un data mart alimenta la business intelligence e l'analytics che guidano le decisioni a livello dipartimentale. I team possono sfruttare insight dei dati mirati tenendo a mente i propri obiettivi specifici. Dal momento che i team identificano ed estraggono dati preziosi in un lasso di tempo più breve, l'azienda beneficia di processi aziendali accelerati e di una maggiore produttività.

  • Manutenzione dei dati più semplice: un data warehouse contiene una grande quantità di informazioni aziendali, con opportunità per più linee di business. I data mart si concentrano su un'unica linea, che contiene meno di 100GB, il che porta a meno disordine e a una manutenzione più facile.

  • Implementazione più facile e più veloce: un data warehouse richiede un tempo di implementazione significativo, specialmente in un'azienda di grandi dimensioni, in quanto raccoglie dati da numerose fonti interne ed esterne. D'altra parte, quando imposti un data mart, hai bisogno solo di un piccolo sottoinsieme di dati e quindi l'implementazione tende ad essere più efficiente e a richiedere minor tempo per l'impostazione.
Tipi di data mart

Sono disponibili tre tipi di data mart, che differiscono in base alla loro relazione con il data warehouse e le rispettive fonti di dati di ogni sistema.

  • I data mart dipendenti sono segmenti partizionati all'interno di un data warehouse aziendale. Questo approccio top-down (dall'alto verso il basso) inizia con lo storage di tutti i dati aziendali in un'ubicazione centrale. I data mart appena creati estraggono un sottoinsieme definito dei dati primari ogni volta che ciò si renda necessario per l'analisi.

  • I data mart indipendenti agiscono come un sistema autonomo che non fa affidamento su un data warehouse. Gli analisti possono estrarre dei dati relativi a un particolare soggetto o processo di business da fonti di dati interne o esterne, elaborarli e poi memorizzarli in un repository di data mart fino a quando il team ne ha bisogno.

  • I Data mart ibridi combinano dati provenienti da data warehouse esistenti e altre fonti operative. Questo approccio unificato sfrutta la velocità e l'interfaccia intuitiva di un approccio top-down (dall'alto verso il basso) e offre anche l'integrazione a livello aziendale del metodo indipendente.
Struttura di un data mart

Un data mart è un database relazionale orientato agli oggetti che memorizza i dati transazionali in righe e colonne, rendendone facile l'accesso, l'organizzazione e la comprensione. Dal momento che contiene dati cronologici, questa struttura consente a un analista di determinare le tendenze dei dati più facilmente. I campi di dati tipici includono ordine numerico, valore temporale e riferimenti a uno o più oggetti.

Le aziende organizzano i data mart in uno schema multidimensionale come un modello per soddisfare le esigenze delle persone che usano i database per svolgere attività analitiche. I tre tipi di schemi principali sono a stella, a fiocco di neve e vault.

A stella
 

Lo schema a stella è una formazione logica di tabelle in un database multidimensionale che ricorda la forma di una stella. In questo modello, una tabella dei fatti, ossia un insieme di metriche che si riferisce a un evento o processo aziendale specifico, risiede al centro della stella, circondata da diverse tabelle di dimensioni associate.

Non esiste alcuna dipendenza tra le tabelle di dimensione, quindi uno schema a stella richiede un numero inferiore di join quando si scrivono le query. Questa struttura rende più facile la creazione di query, quindi gli schemi a stella sono altamente efficienti per gli analisti che desiderano accedere e muoversi in grandi insiemi di dati.

A fiocco di neve
 

Uno schema a fiocco di neve è un'estensione logica di uno schema a stella, ampliando il modello con ulteriori tabelle delle dimensioni. Le tabelle delle dimensioni sono normalizzate per proteggere l'integrità dei dati e ridurre al minimo la ridondanza dei dati.

Anche se questo metodo richiede meno spazio per memorizzare le tabelle delle dimensioni, si tratta di una struttura complessa che può essere difficile da gestire. Il vantaggio principale derivante dall'utilizzo dello schema a fiocco di neve è la ridotta esigenza di spazio su disco, ma lo svantaggio è un possibile impatto negativo sulle prestazioni a causa delle tabelle aggiuntive.

Vault
 

Il data vault è una moderna tecnica di modellazione di database che permette ai professionisti IT di progettare dei data warehouse aziendali agili. Questo approccio implementa una struttura a livelli ed è stato sviluppato specificamente per contrastare i problemi di agilità, flessibilità e scalabilità che sorgono quando si usano gli altri modelli di schemi.

Il data vault elimina la necessità di pulizia dello schema a stella e semplifica l'aggiunta di nuove fonti di dati senza interrompere lo schema esistente.

Chi usa un data mart (e come)?

I data mart sono alla base di importanti decisioni aziendali a livello di reparto. Ad esempio, un team di marketing potrebbe usare i data mart per analizzare i comportamenti dei consumatori, mentre il personale di vendita potrebbe usarli per compilare i rapporti trimestrali sulle vendite. Poiché queste attività vengono svolte all'interno dei rispettivi reparti, i team non hanno bisogno di accedere a tutti i dati aziendali.

In genere, un data mart viene creato e gestito dal reparto aziendale specifico che intende usarlo. Il processo per la progettazione di un data mart comprende solitamente i seguenti passaggi:

  1. Documentare i requisiti essenziali per comprendere le esigenze aziendali e quelle tecniche del data mart.

  2. Identificare le fonti di dati su cui il data mart farà affidamento per le informazioni.

  3. Determinare il sottoinsieme di dati, se si tratta di informazioni su un argomento o di campi specifici ad un livello più dettagliato.

  4. Progettare il layout logico per il data mart scegliendo uno schema che sia correlato al data warehouse più grande.

Una volta completato il lavoro di preparazione, puoi ottenere il massimo valore da un data mart utilizzando strumenti di business intelligence specializzati, come Qlik o SiSense. Queste soluzioni includono un dashboard e delle visualizzazioni che rendono facile individuare degli insight dai dati, che in definitiva determinano delle decisioni più intelligenti che vanno a vantaggio dell'azienda.

Data mart e architettura cloud

Sebbene i data mart offrano alle aziende i vantaggi di una maggiore efficienza e flessibilità, la crescita inarrestabile dei dati pone un problema per le aziende che continuano a utilizzare una soluzione on-premise.

Man mano che i data warehouse si sposteranno verso il cloud, i data mart li seguiranno. Consolidando le risorse di dati in un unico repository che contiene tutti i data mart, le aziende possono ridurre i costi e garantire che tutti i reparti abbiano accesso illimitato e in tempo reale ai dati di cui hanno bisogno.

Le piattaforme basate sul cloud consentono di creare, condividere e archiviare facilmente grandi insiemi di dati, aprendo la strada a un accesso e un'analisi dei dati più efficienti ed efficaci. I sistemi cloud sono creati per una crescita sostenibile del business, con molti provider SaaS (Software-as-a Service) moderni che separano lo storage dei dati dal calcolo per migliorare la scalabilità quando si eseguono query dei dati.

Soluzioni correlate
Db2 Warehouse on Cloud

Esplora le funzionalità di un data warehouse sul cloud completamente gestito ed elastico, progettato per AI e analisi ad alte prestazioni.

Esplora Db2 Warehouse on Cloud
InfoSphere Master Data Management

Scopri come IBM InfoSphere Master Data Management può consentire agli utenti di business e IT di collaborare e realizzare l'innovazione con dati master attendibili in tutta l'azienda.

Esplora InfoSphere Master Data Management
Risorse Trova il data warehouse aziendale giusto per rispondere alla sfida dei dati e dell'AI

L'AI può presentare diverse sfide che i data mart e i data warehouse aziendali possono contribuire a far vincere. Scopri come stimare il valore totale che una soluzione di questo tipo può fornire.

I data lake incontrano i data warehouse

Guarda cosa ha da dire l'analista David Menninger di Ventana Research sull'intersezione tra i data lake e i data warehouse, una considerazione importante quando si crea un data mart.

Passa alla fase successiva

IBM Db2 Warehouse on Cloud è un data warehouse elastico sul cloud che offre una scalabilità indipendente di storage e calcolo. I data mart più piccoli possono usare la funzione Flex One, un data warehouse elastico costruito per un'analisi ad alte prestazioni. Questo sistema può essere implementato su più provider di cloud, a partire da 40 GB di storage.

Esplora IBM Db2 Warehouse on Cloud