Cos'è Apache Avro?

Uomini d'affari che utilizzano tablet digitali in ufficio

Cos'è Avro?

Avro è un progetto open source che fornisce servizi di serializzazione e scambio di dati per Apache Hadoop. Questi servizi possono essere utilizzati insieme o in modo indipendente.

Avro facilita lo scambio di big data tra programmi scritti in qualsiasi linguaggio. Con il servizio di serializzazione, i programmi possono serializzare in modo efficiente i dati in file o in messaggi. Il data storage è compatto ed efficiente. Avro memorizza sia la definizione dei dati che i dati stessi in un unico messaggio o file.

Avro memorizza la definizione dei dati in formato JSON, facilitandone la lettura e l'interpretazione, mentre i dati stessi sono memorizzati in formato binario, il che li rende compatti ed efficienti. I file Avro includono indicatori che possono essere utilizzati per suddividere set di dati di grandi dimensioni in sottoinsiemi adatti per l'elaborazione di Apache MapReduce. Alcuni servizi di scambio dati utilizzano un generatore di codici per interpretare la definizione dei dati e produrre codice per accedere ai dati. Avro non richiede questo passaggio, il che lo rende ideale per i linguaggi di scripting.

Una caratteristica fondamentale di Avro è il solido supporto per gli schemi di dati che cambiano nel tempo, spesso denominati evoluzione dello schema. Avro gestisce le modifiche allo schema, come campi mancanti, campi aggiunti e campi modificati; di conseguenza, i vecchi programmi possono leggere nuovi dati e i nuovi programmi possono leggere vecchi dati. Avro include API per Java, Python, Ruby, C, C++ e altro. I dati memorizzati tramite Avro possono essere trasmessi da programmi scritti in linguaggi diversi, perfino da un linguaggio compilato come C a un linguaggio di scripting come Apache Pig.

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI 

Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think.

Mixture of Experts | 12 dicembre, episodio 85

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Guarda tutti gli episodi di Mixture of Experts

La guida ai dati AI-ready per i leader dei dati

Apprendi i passi attuabili che i responsabili dei dati possono compiere per superare le difficoltà, gettare le basi per una base dati affidabile e preparare i dati dell'organizzazione per l'AI.

Risorse

Gli agenti AI funzionano sui dati: il tuo è pronto?

I dati sono il tuo vantaggio competitivo. Scopri come sbloccarli in modo sicuro e ottenere un ROI misurabile dall'AI in questo breve webinar.

IDC MarketScape: Worldwide Data Intelligence Platform Software 2024 Vendor Assessment

Scopri perché IBM è stata nominata leader in questo rapporto di valutazione IDC che valuta e posiziona i fornitori nel mercato del software di data intelligence.

I tuoi dati sono pronti per la gen AI?

Esplora il nostro hub Data Matters per imparare come affrontare le sfide relative ai dati e all'AI come l'integrazione.

Sblocca il valore dei dati abilitando la condivisione dei prodotti di dati

Scopri le best practice per massimizzare l'efficacia della condivisione interna dei dati per il successo aziendale.

Data intelligence: tira fuori i tuoi dati dall'oscurità

Scopri come l'intelligence dei dati unisce governance, qualità, lineage e condivisione per trasformare dati non elaborati in insight di cui ti puoi fidare.

Dai dati agli insight: tracciare il percorso attraverso la data intelligence

Esplora il processo di trasformazione e le best practice per ricavare insight fruibili dalla data intelligence.

Soluzioni correlate

IBM Knowledge Catalog

Attiva i dati per l'AI e l'analytics con una catalogazione intelligente e una gestione delle policy. IBM Knowledge Catalog è un software di governance dei dati che fornisce un catalogo di dati per automatizzare la gestione della qualità dei dati, la protezione dei dati e il data discovery.

Scopri Knowledge Catalog

Soluzioni IBM Data Intelligence

Trasforma rapidamente i dati non elaborati in insight fruibili, unifica governance, qualità, lineage e condivisione dei dati e offri agli utenti dati affidabili e contestualizzati.

Scopri le soluzioni di data intelligence

Servizi di consulenza per dati e analytics

Sblocca il valore dei dati aziendali con IBM Consulting e crea un'organizzazione basata su insight in grado di generare vantaggi aziendali.

Esplora i servizi di analytics

Prossimi passi

Trova, comprendi, rendi accurati e accedi a dati, asset di conoscenza e relative correlazioni, ovunque risiedano, su cloud oppure on-premise. IBM Knowledge Catalog è un software di governance dei dati che offre un catalogo di dati per automatizzare la data discovery, la gestione della qualità dei dati e la loro protezione.