IBM Cloud Data Engine è il servizio centrale di IBM Cloud per i data lake. La combinazione di IBM Cloud Data Engine con i dati in IBM Cloud Object Storage ti consente di creare uno spazio di lavoro attivo per una vasta gamma di casi d'uso di analytics dei big data.
IBM Cloud Data Engine utilizza Apache Spark, un motore di trattamento dei dati open source, veloce, estendibile e in-memory, ottimizzato per una bassa latenza e l'analisi ad hoc dei dati.
Non è necessaria alcuna definizione di ETL o schema per abilitare le query SQL. Analizza i dati dove si trovano in IBM Cloud Object Storage utilizzando il nostro editor di query e l'API REST.
Esegui tutte le query di cui hai bisogno; con i prezzi pay-per-query, paghi solo la scansione dei dati. Comprimi o effettua una partizione dei dati per massimizzare risparmi e prestazioni.
IBM Cloud Data Engine è altamente disponibile ed esegue query utilizzando risorse di calcolo su più strutture.
Controlla l'accesso ai dati con la Gestione delle identità e degli accessi di IBM e IBM Key Protect. Consenti agli utenti di usufruire del controllo granulare dei tuoi bucket IBM Cloud Object Storage.
IBM Cloud Data Engine supporta una varietà di formati di dati come CSV, JSON e Parquet e lo standard ANSI SQL.
Un servizio di data storage su scala web altamente sicuro, conveniente e resiliente, che garantisce un accesso continuo ai dati.
Trasferisci dataset di grandi dimensioni da e verso IBM Cloud Object Storage in modo affidabile e alla massima velocità.
Accelera lo spostamento sicuro di grandi quantità di dati in IBM Cloud Object Storage tramite dispositivi di storage portatili, resistenti e con una capacità utilizzabile di 120 TB.
Per utilizzare IBM Cloud Data Engine, devi avere un account IBM Cloud Object Store per memorizzare i set di risultati delle query.
Segui questi passaggi per iniziare:
Ora puoi inviare query relative al dataset di esempio o al tuo.
Devi utilizzare sempre i tuoi account IBM Cloud Object Storage. Inoltre, sei responsabile sia di tutti i costi sostenuti tramite l'account IBM Cloud Object Storage sia dei costi di IBM Cloud Data Engine.
1. IBM Cloud Data Engine analizza i dati presenti nei volumi di dati.
2. IBM Cloud Data Engine scrive i risultati in nuovi file nel bucket di IBM Cloud Object Storage specificato.
IBM Cloud Data Engine è basato su Apache Spark e utilizza Spark SQL per eseguire le query. Puoi inviare le query tramite l'interfaccia utente o l'API REST.
Attualmente IBM Cloud Data Engine non è ancora integrato con IBM Watson Knowledge Catalog. Tuttavia, questa integrazione è una delle nostre massime priorità, in modo che i clienti possano pubblicare query, metadati e dataset nel catalogo, nonché fare riferimento agli asset di dati registrati in esso.
IBM Cloud Data Engine è disponibile a livello globale.
IBM Cloud Data Engine ti consente di controllare l'accesso ai dati utilizzando i criteri di Gestione delle identità e degli accessi di IBM.
IBM Cloud Data Engine è progettato per essere altamente disponibile e tollerante ai guasti. Supporta IBM Cloud SLA.
IBM Cloud Data Engine è disponibile in IBM Cloud. Ti verrà addebitato il costo di ciascuna query in base alla quantità di dati analizzati al mese. Non è previsto alcun addebito per le query non riuscite, mentre ti verrà addebitato il costo delle query annullate in base alla quantità di dati analizzati.
No.
Ti verranno addebitati solo i dati già analizzati nel momento in cui hai annullato la query.
Non sono previsti costi aggiuntivi per IBM Cloud Data Engine. I dati memorizzati in IBM Cloud Object Storage sono a pagamento. L'utilizzo di IBM Cloud Data Engine aumenterà il consumo di IBM Cloud Object Storage e il costo mensile. È tua responsabilità eliminare i volumi che non vuoi più conservare in IBM Cloud Object Storage.