Gestión de metadatos

El repositorio de metadatos de IBM® InfoSphere Information Server almacena metadatos de herramientas de suite y de herramientas y bases de datos externas, y permite que estas puedan realizar intercambios. Puede importar metadatos en el repositorio desde varios orígenes, exportar metadatos mediante distintos métodos y transferir activos de metadatos entre repositorios de diseño, prueba y producción.

El repositorio de metadatos

Un solo repositorio de metadatos proporciona a los usuarios de cada herramienta de suite un significado común de la estructura de los datos que fluyen a través de las herramientas de la suite de InfoSphere Information Server. Con un repositorio compartido, los cambios realizados en una herramienta de la suite se hacen visibles automática e instantáneamente en toda la suite.

El repositorio único garantiza que se pueda utilizar una tabla de base de datos importada de una herramienta de base de datos o de diseño de las siguientes formas, entre otras:
  • Para hacer un análisis en IBM InfoSphere Information Analyzer
  • Para crear correlaciones en IBM InfoSphere FastTrack
  • Para crear definiciones de tabla en un trabajo de IBM InfoSphere DataStage and QualityStage
También se puede asignar a la misma tabla un término y un representante en InfoSphere Information Governance Catalog. La tabla también puede formar parte de un informe de linaje de datos que la vincule al diseño de base de datos original, al trabajo que utiliza la tabla y al informe de inteligencia empresarial (BI) basado en la tabla.
El repositorio de metadatos comparte, almacena y reconcilia una gama completa de metadatos:
Metadatos empresariales
Proporcionan contexto empresarial para activos de tecnología de la información y añade significado empresarial a los artefactos creados y gestionados por otras aplicaciones de TI. Los metadatos empresariales incluyen términos de glosario, presentación y ejemplos.
Metadatos operativos
Describen las ejecuciones de los trabajos de IBM InfoSphere DataStage and QualityStage, incluyendo la grabación y lectura de filas y la tabla de base de datos o los archivos de datos que resulten afectados. Puede utilizar InfoSphere Information Governance Catalog para crear informes de linaje de datos que combinen información de diseño y operativa.
Metadatos técnicos
Proporcionan detalles sobre los siguientes tipos de activos:
  • Recursos de datos implementados, incluidos sistemas host, bases de datos y archivos de datos y su contenido. Los activos se pueden importar desde una herramienta de diseño, una base de datos o una herramienta BI.
  • Creación de perfiles, calidad y procesos ETL, proyectos y usuarios, incluidos los trabajos y proyectos creados en InfoSphere DataStage and QualityStage y los análisis de IBM InfoSphere Discovery.
  • Informe BI y metadatos de modelo importados por MetaBrokers and Bridges desde herramientas BI como IBM Cognos y BusinessObjects.
El repositorio de metadatos es una aplicación IBM WebSphere J2EE. El repositorio utiliza tecnología estándar de bases de datos relacionales (como IBM DB2 u Oracle) para la persistencia. Estas bases de datos permiten la realización de copias de seguridad, administración, escalabilidad, transacciones y acceso simultáneo.

Importación y exportación de metadatos

InfoSphere Information Server ofrece muchos métodos de importación de activos de metadatos en el repositorio de metadatos. Algunos métodos incluyen la capacidad de exportar metadatos del repositorio a otras herramientas, archivos o bases de datos. InfoSphere Metadata Asset Manager importa activos al repositorio de metadatos utilizando puentes y conectores.

Conectores y operadores
InfoSphere DataStage and QualityStage utilizan conectores y operadores para conectarse a varias bases de datos con el fin de extraer, transformar y cargar los datos. InfoSphere Information Analyzer e InfoSphere FastTrack utilizan conectores para acceder a las bases de datos. En todos los casos, los metadatos sobre los recursos de datos implementados, incluidos host, base de datos, esquemas, tablas y columnas, se almacenan en el repositorio de metadatos para que los utilicen otras herramientas de la suite.
InfoSphere Metadata Integration Bridges
Bridges le permite importar metadatos en el repositorio de metadatos desde aplicaciones externas, bases de datos y archivos, incluidas herramientas de diseño y herramientas BI. Algunos puentes también pueden exportar metadatos. Puede importar muchos tipos de metadatos, incluidos los siguientes:
  • Sistemas principales, bases de datos, esquemas, procedimientos almacenados, tablas de base de datos, columnas de base de datos y claves foráneas
  • Archivos de datos, estructuras de archivos de datos, campos de archivos de datos
  • Informes BI, modelos y sus activos contenidos
  • Información de análisis de IBM InfoSphere Discovery
  • Modelos de datos lógicos y modelos de datos físicos a partir de herramientas de diseño tales como CA ERwin y IBM InfoSphere Data Architect
  • Usuarios y grupos para designarlos como representantes para los activos del repositorio de metadatos
Intercambio de archivos XML y CSV
Varias herramientas de suite proporcionan interfaces para la importación y exportación de archivos XML y CSV (valores separados por coma) que contienen metadatos de diferentes tipos:
  • Puede utilizar InfoSphere Information Governance Catalog para importar documentos de correlación de extensión y orígenes de datos de extensión que capturan información sobre procesos y orígenes de datos de herramientas, scripts y otros programas que no guardan sus metadatos en el repositorio de metadatos. También puede utilizar el catálogo para importar contenido del glosario, incluidas categorías, términos y relaciones con otros activos.
  • Puede utilizar InfoSphere FastTrack para importar y exportar especificaciones de correlación en formato CSV.

Exploración, análisis y supresión de metadatos de repositorio

Los usuarios de cada herramienta de suite pueden explorar y seleccionar los tipos de activos de metadatos utilizados por la herramienta. Por ejemplo, los usuarios de InfoSphere DataStage and QualityStage pueden seleccionar los trabajos y las etapas y definiciones de tabla utilizadas por los trabajos. Varias herramientas proporcionan una vista más amplia del contenido del repositorio de metadatos:
  • Los usuarios de InfoSphere Information Governance Catalog pueden explorar y consultar la gama completa de activos en el repositorio y ejecutar informes de linaje de datos y de análisis de impacto. Los usuarios también pueden buscar y explorar activos de muchos tipos para asignar términos a los activos o designar representantes o los activos.
  • Mediante el uso de la funcionalidad de gestión de repositorio de InfoSphere Metadata Asset Manager, puede examinar todos los recursos de datos implementados, activos de modelo de datos lógicos, activos de modelos de datos físicos y activos BI en el repositorio de metadatos. Puede suprimir o fusionar varios activos.

Cómo mover los activos entre repositorios de metadatos

Una vez que haya desarrollado y probado los trabajos y procesos, puede moverlos a un entorno de producción. Puede utilizar la línea de mandatos istool para mover los activos de un repositorio de InfoSphere Information Server a otro. Por ejemplo, puede mover los activos de un entorno de desarrollo a un entorno de prueba, y de un entorno de prueba a un entorno de producción.

Mediante la línea de mandatos puede mover varios tipos de activos y las relaciones entre ellos:
  • Trabajos y proyectos de InfoSphere DataStage and QualityStage
  • Categorías, términos y representantes de InfoSphere Information Governance Catalog
  • Resúmenes, proyectos y medidas de análisis de InfoSphere Information Analyzer
  • Especificaciones de correlación de IBM InfoSphere FastTrack
  • Recursos de datos implementados, incluidos metadatos para bases de datos, esquemas, tablas, columnas y archivos de datos.
  • Activos de modelos de datos lógicos y activos de modelos de datos físicos.
  • Metadatos BI, incluidos los informes BI, los modelos BI y sus activos contenidos
  • Usuarios, roles e informes de InfoSphere Information Server
Las siguientes herramientas también tienen interfaces de usuario para mover los activos entre repositorio de metadatos:
  • InfoSphere DataStage and QualityStage
  • InfoSphere Data Architect
  • InfoSphere Information Governance Catalog
  • InfoSphere Information Analyzer

Caso de ejemplo para la gestión de metadatos

La posibilidad de gestión global de metadatos ofrece a los usuarios de InfoSphere Information Server un método común para tratar la información descriptiva sobre el uso de los datos. Los casos de ejemplo siguientes describen usos de esta posibilidad.

Análisis de empresa
Un importante proveedor de cursos de formación con fines lucrativos necesitaba diseñar una estrategia para retener el mayor número de alumnos. Los directores de la empresa deseaban analizar el ciclo de vida de los alumnos desde el momento de su solicitud del curso hasta su graduación con objeto de dirigir sus esfuerzos a conseguir alumnos con la mayor probabilidad de éxito.

Para satisfacer este imperativo empresarial, la empresa diseñó y ofreció una solución de inteligencia empresarial utilizando un almacén de datos. El depósito contenía una vista única de información de los alumnos llena con datos de sistemas operativos.

La organización de tecnología de la información utiliza InfoSphere Information Server y su repositorio de metadatos para coordinar los metadatos en todo el proyecto. Otras herramientas utilizadas incluyen Embarcadero ER/Studio para el modelado de datos e IBM Cognos para la inteligencia empresarial. Los informes generados muestran una vista precisa de las tendencias de los alumnos a lo largo del período comprendido entre la solicitud y la graduación.

Los consumidores pueden comprender el significado de los campos en sus informes BI accediendo a las definiciones de empresa en InfoSphere Information Governance Catalog. Esto les permite identificar factores clave que correlacionan las características de los alumnos y la retención. También pueden comprender el origen de los datos en los informes utilizando el linaje de negocio, que les permite confiar en los orígenes y el flujo de los datos que buscan. El resultado neto es la capacidad de tomar mejores decisiones con más seguridad, lo que permite al proveedor de cursos de formación diseñar e implementar iniciativas eficaces para retener alumnos.