¿Qué es la administración de datos?

Dos personas sentadas juntas en un escritorio y observan una gran pantalla de ordenador y una tablet.

Autores

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

¿Qué es la administración de datos?

La administración de datos es un conjunto de prácticas de gestión de datos diseñadas para ayudar a garantizar la alta calidad y accesibilidad de los datos. Los programas de administración de datos suelen funcionar en consonancia con las políticas de gobierno de datos de una organización.
 

Los administradores de datos son los encargados de dirigir los programas de administración de datos. Las responsabilidades específicas de los administradores de datos incluyen la definición de métricas de calidad de los datos, la gestión de metadatos y datos de referencia, el seguimiento del linaje de los datos y la clasificación de los datos sensibles.

Diferentes tecnologías y herramientas pueden respaldar los flujos de trabajo de los administradores de datos, como la inteligencia artificial (IA), los catálogos de datos, las bases de datos relacionales, las plataformas de calidad de datos y el software de gobierno de datos.

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA 


Descubra ideas y noticias de expertos sobre IA, nube y mucho más en el boletín semanal Think. 

¿Por qué es importante la administración de datos?

Hoy en día, las empresas recopilan y analizan más datos que nunca con la esperanza de desbloquear información valiosa. Sin embargo, la recopilación y el análisis de datos por sí solos no bastan para garantizar resultados satisfactorios. La administración de datos y los administradores de datos pueden apoyar y guiar el uso eficaz de los datos dentro de una cultura basada en datos.

En los últimos años, con la creciente adopción de la IA, la administración de datos ha adquirido una importancia adicional. Los sistemas de IA consumen y producen cantidades ingentes de datos. La administración de datos ayuda a garantizar la calidad e integridad de esos datos para que los procesos empresariales con IA sean eficaces, cumplan la normativa gubernamental y se ajusten a las normas éticas y de gobierno de la IA.

Los buenos programas de gestión de datos permiten la conservación de los mismos mediante la mejora de su calidad, accesibilidad, facilidad de uso y seguridad. Los administradores de datos ayudan a garantizar que los empleados puedan acceder a datos empresariales útiles y precisos para facilitar la toma de decisiones basada en datos y el aumento de la productividad impulsado por IA. Los beneficios adicionales de la administración de datos incluyen una interpretación de los datos más coherente y una mejor preparación para la auditoría.

A menudo, los administradores de datos colaboran con una serie de partes interesadas, como propietarios de datos, analistas de datos, expertos en ciencia de datos y usuarios empresariales en general, para lograr estos beneficios.

Los empleados que no están reconocidos formalmente como "administradores de datos" pueden, no obstante, tener responsabilidades de administración de datos y dedicar mucho tiempo a satisfacer las necesidades de datos de sus organizaciones, como inventariar los datos y evaluar su calidad. Sin embargo, algunos expertos en gestión de datos afirman que formalizar las funciones de administración de datos es importante, ya que indica que una empresa se toma en serio la gestión de la calidad de los datos.1

AI Academy

¿Es la gestión de datos el secreto de la IA generativa?

Explore por qué los datos de alta calidad son esenciales para el uso satisfactorio de la IA generativa.

¿Cuál es la diferencia entre administración de datos y gobierno de datos?

El gobierno de datos y la administración de datos son conceptos distintos pero relacionados. Los programas de gobierno de datos de las empresas ayudan a garantizar la integridad y la seguridad de los datos mediante políticas, normas y procedimientos de recopilación, propiedad, almacenamiento, tratamiento y uso de los datos. Muchas de las responsabilidades de la administración de datos implican la aplicación de las normas descritas en los marcos del gobierno del dato. Como tal, la administración de datos puede considerarse el "aspecto operativo" del gobierno de datos.2

¿Cuáles son los diferentes tipos de administradores de datos?

Las empresas con programas de administración de datos más maduros pueden tener diferentes tipos de funciones de administración de datos, entre las que se incluyen:

  • Administrador de datos empresariales: los administradores de datos empresariales se especializan en la gestión de datos dentro de funciones empresariales específicas, como marketing o servicio de atención al cliente.

  • Administrador técnico de datos: como sugiere su título, el administrador técnico de datos posee experiencia técnica en procesos y sistemas de datos, incluidos los procesos de extracción, transformación y carga (ETL) y los almacenes de datos.

  • Enterprise data steward: los administradores de datos empresariales dirigen comunidades de administradores de datos dentro de las organizaciones y sirven de enlace con otros líderes empresariales.3

¿Cuáles son los casos de uso de la administración de datos?

Entre los casos de uso de la administración de datos se incluyen:

  • Master Data Management
  • Mejora de la calidad de los datos
  • Gestión de metadatos
  • Gestión de datos de referencia
  • Resolución de identidad
  • Seguridad de la información y protección de datos
  • Rastreo del linaje de datos
  • Gestión de riesgos de los procesos empresariales

Master Data Management

La administración de datos suele ser clave para la gestión de datos maestros (MDM), que es un enfoque para gestionar los datos críticos de una organización mediante tecnología, herramientas y procesos. Las organizaciones utilizan la MDM para crear una única fuente fiable que integre datos de diversas fuentes, de modo que todos los usuarios de datos trabajen con la misma información.

A menudo, las empresas y los administradores de datos comienzan a implantar una iniciativa de MDM en un único dominio de datos (agrupaciones lógicas de datos similares, como datos de clientes o datos de empleados) antes de ampliar este trabajo a todos los activos de datos de la organización.4

Mejora de la calidad de los datos

Los administradores de datos pueden mejorar la calidad de los datos revisando el contenido de una base de datos, lo que se conoce como perfilado de datos. También trabajan con las partes interesadas en los datos para crear definiciones de datos, diseñar métricas de calidad de datos y establecer reglas de negocio para los datos, como qué valores se consideran válidos o inválidos.

Por ejemplo, como se explica en el libro "Data Stewardship", cuando los datos recogidos son el estado civil de un cliente, una regla podría establecer que "soltero", "casado", "viudo" o "divorciado" serían valores válidos, mientras que una respuesta en blanco se consideraría inválida.5 Los administradores de datos también pueden contribuir a resolver los problemas de calidad de los datos cuando surjan.

Gestión de metadatos

Los metadatos son información que describe un punto de datos o un conjunto de datos, como la fecha de creación de los datos o los detalles de autoría. Los administradores de datos pueden ser responsables de crear metadatos de alta calidad y evaluar la calidad de los metadatos existentes. Al igual que ocurre con la calidad general de los datos, los administradores de datos se encargan de resolver los problemas de calidad de los metadatos.

Gestión de datos de referencia

Los administradores de datos suelen mantener datos de referencia, que son datos que categorizan otros datos dentro de la empresa. Algunos ejemplos de datos de referencia son los códigos de país, la información sobre divisas y los códigos de producto. Mediante la documentación de los datos, los administradores pueden registrar los valores válidos de los datos de referencia, evaluar si son necesarios nuevos valores válidos y conciliar los valores de los datos de referencia en distintos sistemas.

En el último caso, si tomamos como ejemplo el estado civil, un administrador de datos podría encargarse de determinar qué medidas tomar cuando un sistema permite "viudo" y "divorciado" como datos del estado civil, mientras que otro solo acepta "casado" y "soltero".6

Resolución de identidad

A menudo, varias instancias de datos representan la misma entidad. Pensemos, por ejemplo, en un cliente que aparece varias veces en la base de datos de una cadena de farmacias porque se le han recetado medicamentos en distintos establecimientos.

Mediante un proceso conocido como resolución de identidades, los administradores de datos determinan cuándo diferentes instancias de datos se refieren a la misma entidad. En el caso del cliente de la farmacia, por ejemplo, la resolución de identidades puede ayudar a garantizar que se detecten interacciones farmacológicas potencialmente peligrosas al surtir las recetas del cliente.7

Seguridad de la información y protección de datos

La seguridad de la información es la protección de la información importante contra el acceso, la divulgación, el uso, la alteración o la interrupción no autorizados. La normativa sobre protección de datos obliga a las empresas a mejorar la protección de la información sensible, como los datos sanitarios. También están obligadas a cumplir las normas que rigen el intercambio de datos, la limitación de la recopilación de datos, etc. Los administradores de datos pueden desempeñar un papel en la protección de datos y el cumplimiento de la normativa al crear y establecer clasificaciones de seguridad para los distintos tipos de datos.

Rastreo del linaje de datos

El linaje de datos es el proceso de seguimiento de los ciclos de vida de los datos, que proporciona una comprensión clara de dónde se originaron los datos, cómo han cambiado y su destino final. Los administradores de datos pueden rastrear el linaje, lo que ayuda a una organización a afirmar la integridad de los datos a efectos de presentación de informes reglamentarios.

Gestión de riesgos de los procesos empresariales

La mala calidad de los datos puede poner en peligro los procesos empresariales. Los administradores de datos pueden trabajar con los responsables de los procesos empresariales para determinar el uso de los datos en un proceso y el grado de vulnerabilidad de éste en caso de que la calidad de los datos sea deficiente.8

¿Qué tecnologías y herramientas apoyan la administración de datos?

Las organizaciones pueden implantar diversas soluciones y herramientas para apoyar las actividades de administración de datos, entre ellas:

  • Inteligencia Artificial (IA)
  • Catálogos de datos
  • Herramientas de análisis y elaboración de perfiles de datos
  • Sistemas de gestión de bases de datos relacionales (RDBMS)
  • Software de gobierno de datos

Inteligencia artificial

La IA y la administración de datos mantienen lo que algunos podrían considerar una relación simbiótica. Mientras que la administración de datos ayuda a garantizar que los sistemas de IA trabajen con datos de alta calidad, las herramientas basadas en IA pueden optimizar las tareas de administración de datos. Por ejemplo, las herramientas de preparación de los datos basadas en IA pueden realizar comprobaciones de validación y detectar errores como un formato incorrecto, mientras que las herramientas de prevención de pérdida de datos impulsadas por IA pueden detectar información sensible y aplicar los controles de seguridad necesarios.

Catálogos de datos

Un catálogo de datos es un inventario de todos los activos de datos de una organización. Está diseñado para ayudar a los administradores de datos y a otros profesionales del sector a encontrar información de forma fácil y rápida. Los metadatos asociados a cada activo de datos permiten la búsqueda en el catálogo.

Herramientas de análisis y elaboración de perfiles de datos

Las herramientas de análisis y elaboración de perfiles de datos pueden evaluar la coherencia y calidad de los datos. Entre las características de estas herramientas se incliuyen capacidades de identificación de anomalías, validación de fuentes de datos y resumen de los resultados del análisis en informes personalizados.

Sistemas de gestión de bases de datos relacionales

Una forma en que los administradores de datos organizan los datos es a través de bases de datos relacionales. Una base de datos relacional (RDB) es un tipo de base de datos en la que los datos se organizan en filas y columnas. Las tablas resultantes podrían vincularse entre sí para demostrar relaciones entre puntos de datos. Los sistemas de gestión de bases de datos relacionales (RDBMS) son soluciones de software que los administradores de datos y otros pueden utilizar para mantener y actualizar las RDB.

Software de gobierno de datos

Los programas de software de gobierno de datos suelen incorporar herramientas de análisis y elaboración de perfiles de datos, así como capacidades impulsadas por IA. Las características pueden incluir el enriquecimiento de metadatos con IA, la creación de catálogos de datos, el rastreo del linaje de datos y el establecimiento de un control de acceso a datos basado en roles.

Notas a pie de página

Todos los enlaces son externos a ibm.com.

1, 4 Allen et al. "Multi-Domain Master Data Management". Morgan Kaufmann. 10 de abril de 2015.

2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, Second Edition” ["Administración de datos, 2ª edición"]. Academic Press. 20 de noviembre de 2020.

Soluciones relacionadas
Software y soluciones de gestión de datos

Diseñe una estrategia de datos que elimine los silos, reduzca la complejidad y mejore la calidad de los datos para ofrecer experiencias excepcionales a clientes y empleados.

Explore las soluciones de gestión de datos
IBM watsonx.data

Watsonx.data le permite escalar el análisis y la IA con todos sus datos, residan donde residan, a través de un almacén de datos abierto, híbrido y controlado.

Descubra watsonx.data
Servicios de asesoramiento sobre datos y análisis

Desbloquee el valor de los datos empresariales con IBM Consulting y construya una organización impulsada por conocimientos que ofrezca ventajas empresariales.

Descubra los servicios de análisis
De el siguiente paso

Diseñe una estrategia de datos que elimine los silos, reduzca la complejidad y mejore la calidad de los datos para ofrecer experiencias excepcionales a clientes y empleados.

Explore las soluciones de gestión de datos Descubra watsonx.data