Para permitir la observabilidad y la supervisión continuas de Spark, IBM® Databand ofrece una integración perfecta de Databricks con las cargas de trabajo de Spark.
IBM Databand proporciona funcionalidades de observabilidad de Spark en el contexto de sus canalizaciones más amplias para que pueda detectar incidencias de datos antes y resolverlas más rápidamente.
Databand recopila metadatos específicos de Spark, como métricas de trabajo, así como registros de ejecución de Spark en aplicaciones Spark Python y Scala/Java. Esto incluye capacidades de supervisión avanzadas para despliegues de Spark en watsonx.data, EMR, Databricks y Dataproc.
Reciba alertas en tiempo real sobre las ejecuciones de Spark y los incidentes relacionados con la calidad de los datos.
Visualice las tendencias históricas de los distintos procesos de Spark para detectar anomalías e incidentes.
Utilice el seguimiento de incidentes de tiempo de ejecución de Databand para ver cómo las ejecuciones de Spark afectan a los datos posteriores.