Watson Knowledge Catalog en Cloud Pak for Data

Versión: 4.5.3    Incluido   IBM

Descripción

Watson Knowledge Catalog proporciona una plataforma segura de gestión de catálogos de empresa que está soportada por la infraestructura de gobernabilidad de datos. Un catálogo conecta personas con los datos y con los conocimientos que necesita. La infraestructura de gobernabilidad de datos garantiza el acceso a datos y que la calidad de los datos cumpla con sus reglas y estándares empresariales. Watson Knowledge Catalog proporciona un control preciso de qué tareas pueden realizar los usuarios combinando los roles y permisos de usuario y los roles de colaborador que controlan qué acciones pueden realizar los usuarios.

La infraestructura de gobierno de datos consta de artefactos de gobierno que mejoran los activos de datos y protegen los datos confidenciales frente a un acceso no autorizado. Los artefactos de gobierno están organizados en categorías y sujetos al flujo de trabajo. Los analistas de datos y los analistas de calidad de datos que son colaboradores en categorías y que tienen los roles necesarios pueden crear artefactos de gobierno, importar artefactos de archivos o importar artefactos de Knowledge Accelerators.

Un catálogo constituye la forma en que comparte activos en su empresa:

  • Los colaboradores de un catálogo tienen acceso a los activos de datos sin necesidad de tener credenciales separadas o poder ver las credenciales.
  • Un activo de un catálogo consta de metadatos acerca de los datos, incluido cómo acceder a los datos, a los datos, el formato de los datos, la clasificación del activo, qué colaboradores pueden acceder a los datos, y otros tipos de metadatos que describen los datos. Los activos de datos pueden incluir los datos relacionales y los datos no estructurados, tal como documentos PDF o Microsoft Office.

El catálogo predeterminado se crea automáticamente después de instalar el servicio de Watson Knowledge Catalog. Se diferencia de otros catálogos de estos modos:

  • Los analistas de datos y los analistas de calidad de datos pueden crear proyectos de calidad de datos y utilizar el descubrimiento automatizado para importar metadatos sobre conjuntos de datos, asignar automáticamente artefactos de gobierno y analizar la calidad de los conjuntos de datos. A continuación, pueden publicar los conjuntos de datos como activos de datos en el catálogo predeterminado.
  • La vista de activos de información muestra propiedades adicionales de los activos en el catálogo predeterminado.

Los encargados de datos y los analistas de calidad de datos pueden importar metadatos de activos a un proyecto para enriquecer los activos mediante la creación de perfiles, el análisis de calidad y la asignación de términos empresariales. Los expertos de datos y los analistas empresariales pueden copiar activos de catálogo en proyectos de análisis para analizar datos y crear modelos. También pueden publicar datos y activos analíticos en cualquier catálogo. Watson Knowledge Catalog incluye estas herramientas en los proyectos de análisis:

  • La herramienta Data Refinery para preparar y visualizar datos.
  • La herramienta de importación de metadatos para importar metadatos de activos en un proyecto o un catálogo.
  • La herramienta de enriquecimiento de metadatos para perfilar datos, analizar la calidad de los datos, asignar automáticamente artefactos de gobernabilidad a los activos de datos y, a continuación, publicar los activos de datos con los resultados de enriquecimiento en un catálogo de su elección.
  • Reglas de calidad de datos para evaluar la calidad de los datos.

La ilustración siguiente muestra la arquitectura de Watson Knowledge Catalog.

Un diagrama de arquitectura que representa las relaciones que se acaban de describir entre los diversos tipos de colaboradores, los catálogos y sus activos.

Enlaces rápidos

Servicios integrados

Tabla 1. Servicios relacionados. Los siguientes servicios relacionados se utilizan a menudo con este servicio y proporcionan características complementarias, pero no son necesarios.
Servicio Prestación
Watson™ Studio Prepare, analice y modele datos en un entorno de colaboración con herramientas para científicos de datos, desarrolladores y expertos del dominio.
Data Virtualization Integre orígenes de datos de varios tipos y ubicaciones en una vista de datos lógica.
Cognos® Dashboards Identifique patrones en los datos con visualizaciones sofisticadas. No se necesita ninguna codificación.

Orígenes de datos compatibles

Consulte Orígenes de datos soportados para obtener una lista de servicios de orígenes de datos compatibles.