Para permitir la observabilidad y la supervisión continuas de Spark, IBM® Databand ofrece una integración perfecta de Databricks con las cargas de trabajo de Spark.
IBM® Databand proporciona funcionalidades de observabilidad de Spark en el contexto de sus canalizaciones más amplias para que pueda detectar incidencias de datos antes y resolverlas más rápidamente.
Databand recopila metadatos específicos de Spark, como métricas de trabajo, así como registros de ejecución de Spark en aplicaciones Spark Python y Scala/Java. Esto incluye funciones de supervisión avanzadas para implementaciones de Spark en watsonx.data, EMR, Databricks y Dataproc.
Reciba alertas en tiempo real sobre las ejecuciones de Spark y los incidentes relacionados con la calidad de los datos.
Visualice las tendencias históricas de los distintos procesos de Spark para detectar anomalías e incidentes.
Utilice el seguimiento de incidencias de ejecución de Databand para ver cómo las ejecuciones de Spark afectan a los datos posteriores.