Métricas

Las métricas son objetos definidos por el usuario que no analizan datos pero proporcionan prestaciones de cálculo matemático que pueden realizarse en resultados estadísticos de las reglas de datos, los conjuntos de reglas de datos y las propias métricas.

Las métricas le proporcionan la capacidad de consolidar las mediciones de diversos pasos de análisis de datos en una sola métrica con significado para la gestión de la calidad de datos. Las métricas pueden utilizarse para reducir cientos de resultados analíticos detallados a unas cuantas métricas con significado que expliquen con eficacia la condición global de la calidad de los datos.

A un nivel básico, una métrica puede expresar un coste o un factor de ponderación en una regla de datos. Por ejemplo, el coste de corregir una fecha de nacimiento que falte podría ser de $1.50 por excepción. Esto puede expresarse como una métrica donde:

A un nivel más complejo, el coste de una fecha de nacimiento que falte podría ser el mismo de $1.50 por excepción, mientras que un tipo de cliente erróneo es sólo $0.75, pero un ID de impuesto erróneo cuesta $25.00. La condición de la métrica es:

(Date of Birth Rule Not Met # * 1.5 ) +
(Customer Type Rule Not Met # * .75 ) +
(TaxID Rule Not Met # * 2.5 )

Las métricas también pueden aprovecharse como super reglas que tengan acceso a salidas estadísticas de reglas de datos, conjuntos de reglas y métricas. Pueden incluir pruebas para variaciones de fin de día, fin de mes o fin de año. O bien podrían reflejar la evaluación de totales entre dos tablas, por ejemplo un proceso de origen a destino o un origen que genere resultados para una tabla aceptada y una rechazada, y el total de la suma debe coincidir.