Data governance, o gobernanza de datos es la disciplina de la gestión de datos que se centra en la calidad, la seguridad y la disponibilidad de los datos de una organización.
La gobernanza de datos ayuda a garantizar la integridad y la seguridad de los datos mediante la definición e implementación de políticas, estándares y procedimientos para la recopilación, propiedad, almacenamiento, procesamiento y uso de datos.
El objetivo de la gobernanza de datos es mantener datos seguros y de alta calidad a los que se pueda acceder fácilmente para las iniciativas de descubrimiento de datos y business intelligence. Actuando más bien como un centro de control de tráfico aéreo, la función de gobernanza de datos ayuda a garantizar que los datos Verify fluyan a través de canalizaciones seguras hacia endpoint y usuarios confiables.
La inteligencia artificial (IA), el big data y los esfuerzos de transformación digital son los principales controladores de los programas de gobernanza de datos. A medida que aumenta el volumen de datos procedentes de nuevas fuentes de datos, como las tecnologías del Internet de las cosas (IoT), las organizaciones deben reconsiderar sus prácticas de gestión de datos para escalar sus esfuerzos de business intelligence (BI).
Los programas de gobernanza de datos pueden ayudar a las organizaciones a proteger y gestionar grandes cantidades de datos al mejorar la calidad de los datos, reducir los silos de datos, aplicar políticas de cumplimiento normativo y seguridad y distribuir el acceso a los datos de manera adecuada.
La gobernanza de datos es un subconjunto de la gestión de datos, que es la práctica general de recopilar, procesar y utilizar datos de forma segura y eficiente para respaldar la toma de decisiones estratégicas y mejorar los resultados empresariales.
Si bien la gestión de datos incluye la gobernanza de datos, también incluye otras áreas del ciclo de vida de estos, como el procesamiento, el almacenamiento y la seguridad de los datos. Además, los diversos aspectos del proceso de gestión de datos tienen una influencia recíproca.
Debido a que estas otras áreas de gestión de datos pueden afectar la gobernanza de datos, varios equipos deben trabajar juntos para diseñar y seguir una estrategia de gobernanza de datos.
Por ejemplo, un equipo de gobernanza de datos podría identificar puntos en común entre conjuntos de datos dispares. Si desean integrar esos datos, generalmente trabajarán con un equipo de gestión de datos para definir el modelo de datos y la arquitectura de datos para facilitar esos vínculos.
Otro ejemplo es el acceso a los datos, en el que un equipo de gobernanza de datos puede establecer las políticas relativas al acceso a tipos específicos de datos, como la información de identificación personal (PII). A continuación, un equipo de administración de datos proporcionará ese acceso directamente o creará el mecanismo para proporcionar ese acceso, a menudo a través del control de acceso basado en roles (RBAC).
Un marco de gobernanza de datos detalla las estructuras y procesos de una organización para gestionar activos críticos. Define la propiedad y las responsabilidades de los datos y especifica cómo deben gestionarse los datos para mantener la calidad de los datos, la seguridad y el cumplimiento.
No existe un solo marco que funcione para todos los casos, ya que estos suelen ser hojas de ruta personalizadas para los sistemas de datos, las fuentes de datos, los protocolos de la industria y las regulaciones del gobierno específicos de una organización en particular.
Los marcos de gobernanza de datos suelen abordar aspectos como:
Los programas de gobernanza de datos generalmente definen un objetivo específico o un conjunto de objetivos, como mejorar la calidad de los datos, respaldar el cumplimiento normativo o permitir la toma de decisiones basada en datos. También seleccionan métricas para medir el avance hacia estos objetivos. Las métricas clave de gobernanza podrían incluir:
Reducciones en errores de datos y redundancia.
Reducciones de costos gracias a una mayor eficiencia y un tiempo de comercialización más rápido.
Coherencia e integridad de los datos.
El nivel de conocimientos sobre los datos y cumplimiento de procesos de los empleados.
Los programas de gobernanza también definen las funciones y responsabilidades de todos los involucrados: el comité directivo, los propietarios de datos, los administradores de datos y los stakeholders.
Los marcos de gobierno establecen parámetros en torno a los datos que deben gobernarse y los resultados deseados. Esto incluye el establecimiento de directrices para formatos de datos, modelos de datos, gestión de datos maestros (MDM), metadatos, convenciones de nomenclatura y mucho más.
Los marcos de gobernanza a menudo mapean los flujos de datos y definen cómo se recopilarán, almacenarán, moverán y archivarán los datos. También podrían identificar el hardware, el software y los servicios que respaldarán los esfuerzos de gobernanza y la arquitectura de datos más amplia de la organización.
Algunas infraestructuras de gobernanza pueden definir alcances de datos, que son parámetros de acceso para activos de datos específicos, como datos maestros, metadatos y datos históricos. Un alcance de datos puede ayudar a garantizar que los usuarios y las aplicaciones solo tengan acceso a los datos que necesitan y que nadie tenga acceso a los datos que no deberían.
Los marcos de infraestructura describen procedimientos de prueba, auditoría y mantenimiento de registros para mantener la transparencia y explicabilidad del programa de gobernanza.
Las auditorías periódicas pueden ayudar a verificar que los usuarios cumplen con el marco de gobernanza de datos. Las auditorías también pueden ayudar a identificar las formas en que el programa de gobierno debe evolucionar para dar cuenta de nuevos datos, procesos o tecnologías.
Por último, las auditorías también pueden ayudar a las organizaciones a lograr y demostrar el cumplimiento normativo.
La tecnología desempeña un papel importante en la eficacia de la gobernanza de datos. Las herramientas de gobierno de datos empresariales pueden variar desde plataformas integrales hasta soluciones puntuales especializadas. Las organizaciones eligen diferentes herramientas según sus arquitecturas de datos y marcos de gobernanza únicos.
Entre las capacidades comunes de las soluciones de gobernanza de datos se encuentran:
Detectar y clasificar datos automáticamente.
Aplicar reglas de protección de datos y controles de acceso basados en roles.
Satisfacer los requisitos de privacidad de datos y cumplimiento normativo.
La automatización de la gestión de metadatos, catalogación de datos y seguimiento del linaje de datos.
Admitir un glosario empresarial.
Las soluciones de gobernanza de datos pueden manejar varios formatos de datos. Algunos ofrecen capacidades de visualización para mejorar la comprensión de conjuntos de datos y relaciones complejas, lo que facilita la identificación de tendencias, valores atípicos y áreas que requieren atención.
La implementación de un marco sólido de gobernanza de datos puede ayudar a las organizaciones a obtener una amplia variedad de beneficios:
Las organizaciones no pueden tomar decisiones empresariales eficaces si esas decisiones se basan en datos defectuosos. La gobernanza de datos puede ayudar a garantizar la integridad, exactitud, exhaustividad y coherencia de los datos mediante la creación de un marco que apoye una sólida administración de datos y un sólido proceso de gestión de datos de extremo a extremo.
Los datos confiables ayudan a las organizaciones a descubrir nuevas oportunidades, comprender mejor a sus clientes y flujos de trabajo, así como a optimizar el rendimiento general del negocio.
La falta de gobernanza de datos puede dar lugar a errores en las métricas de rendimiento que lleven a una organización en la dirección equivocada, mientras que las herramientas de gobernanza de datos pueden ayudar a abordar las imprecisiones antes de que influyan en la estrategia.
Por ejemplo, las herramientas de linaje de datos pueden ayudar a los propietarios de datos a rastrear los datos a lo largo de su ciclo de vida, incluyendo cualquier transformación que experimenten los datos durante los procesos de extracción, transformación, carga (ETL) o extracción, carga, transformación (ELT). Esto permite a las organizaciones identificar y corregir la causa principal de los errores de datos.
Cuando el acceso a los datos está restringido en toda una organización, puede limitar la innovación, crear dependencias en los expertos en la materia (SME) y ralentizar los procesos de negocio.
Los programas de gobernanza de datos distribuyen el acceso a los datos de manera adecuada, al otorgar acceso a cada departamento o persona solo a los datos que necesitan. Esto permite que los equipos multifuncionales trabajen juntos de manera más estrecha y eficiente mientras mantienen los datos seguros.
Un sistema de datos gestionado de manera correcta puede proporcionar una única fuente de información en toda la organización. La toma de decisiones puede mejorar cuando todas las partes trabajan con los mismos conjuntos de datos.
Centralizar las definiciones de datos y metadatos en un único catálogo de datos puede ayudar a reducir la confusión y la ineficacia. Esta documentación, a su vez, se convierte en la base de las soluciones de autoservicio que permiten la coherencia de los datos y el acceso a los mismos en toda la organización.
Las políticas de gobernanza de datos suelen incluir operaciones para cumplir con más facilidad las normativas gubernamentales relativas a los datos confidenciales y la privacidad, como el Reglamento General de Protección de Datos (RGPD) de la UE, la Ley de Portabilidad y Responsabilidad del Seguro Médico de EE. UU. (HIPAA) y requisitos de la industria como el del Estándar de Seguridad de Datos para la Industria de Tarjeta de Pago (PCI DSS). Las violaciones de estos requisitos regulatorios podrían dar lugar a costosas multas gubernamentales y reacciones negativas del público.
Las herramientas de gobernanza de datos ayudan a las organizaciones a establecer medidas de protección que pueden prevenir filtraciones de datos, fugas y uso indebido. Los marcos de gobernanza ayudan a construir sistemas de datos que sean claros, explicables, justos e inclusivos. A su vez, estos sistemas de datos protegen la privacidad y la seguridad y mantienen la lealtad y la confianza de los clientes.
En una encuesta de IDC, solo el 45.3 % de los encuestados dijo que tenía "reglas, políticas y procesos para hacer cumplir sus principios de IA responsable" para protegerse contra violaciones de seguridad, preocupaciones de responsabilidad, datos expuestos de clientes y riesgo regulatorio.1
La gobernanza de datos requiere que se conozca el origen, la sensibilidad y el ciclo de vida de todos los datos que usa una organización. Esta es la base de cualquier práctica de gobernanza de la IA y es crucial para mitigar diversos riesgos empresariales.
La gobernanza de datos ayuda a las organizaciones a aportar datos de alta calidad a las iniciativas de IA y aprendizaje automático (ML), al mismo tiempo que protege esos datos y cumple las normas y reglamentos pertinentes. Por ejemplo, las herramientas de gobierno pueden ayudar a garantizar que los datos personales confidenciales no se transmitan a una IA cuando no debería ser así.
Disponer de los datos adecuados es la base de las iniciativas avanzadas de analytics de datos y ciencia de datos. Los datos cuidadosamente controlados permiten iniciativas valiosas, como informes de business intelligence o proyectos de machine learning (ML) predictivo más complejos.
Por ejemplo, la creación adecuada de perfiles de datos (comentarios y limpieza de datos para comprender mejor cómo están estructurados) puede ayudar a comprender mejor la relación entre los diferentes conjuntos de datos y fuentes.
Las iniciativas de gobernanza de datos pueden enfrentar muchos obstáculos en la implementación. Algunos de estos desafíos incluyen:
Los programas de gobernanza de datos eficaces suelen requerir el patrocinio de dos niveles: el de los ejecutivos y el de quienes realizan aportaciones individuales. Los directores de datos (CDO) y los administradores de datos son críticos en la comunicación y la priorización de la gobernanza de datos dentro de una organización.
Los CDO pueden supervisar y responsabilizar a los equipos de datos para ayudar a garantizar que se adopten las políticas de gobernanza de datos. Los administradores de datos pueden ayudar a difundir la concientización sobre estas políticas entre los productores y consumidores de datos para fomentar el cumplimiento en toda la organización.
Sin el patrocinio adecuado, los usuarios de datos podrían desconocer las políticas de gobernanza o no preocuparse por ellas. Esto puede dar lugar a incumplimientos, una integridad deficiente de los datos y una seguridad de datos comprometida.
Sin las herramientas y la arquitectura de datos correctas, las organizaciones podrían tener dificultades para desplegar un programa eficaz de gobernanza de datos.
Por ejemplo, los equipos podrían descubrir datos redundantes en diferentes funciones. Para hacer posible un gobierno eficaz, los arquitectos de datos deben desarrollar modelos de datos y arquitecturas de datos adecuados para fusionar e integrar datos en todos los sistemas de almacenamiento.
Es posible que los equipos también necesiten adoptar un catálogo de datos para crear un inventario de activos de datos en una organización. O si ya tienen uno, es posible que necesiten crear un proceso para la gestión de metadatos que ayude a garantizar que los datos subyacentes sean relevantes y estén actualizados.
La gobernanza de datos, especialmente en entornos híbridos y multinube, a menudo implica datos almacenados en múltiples formatos en múltiples proveedores y ubicaciones. Además, los datos pueden residir en diferentes tipos de almacenes de datos, como lagos de datos, lakehouses de datos y almacenes de datos.
La TI en la sombra puede suponer un obstáculo adicional para el proceso. En un estudio de TechTarget, el segundo desafío de seguridad de datos más común informado fue que los empleados se registraban en aplicaciones y servicios en la nube sin la aprobación de TI.2
Esta distribución de datos puede dificultar el seguimiento y el monitoreo de los flujos de datos y el uso de datos. La gobernanza de datos requiere un conocimiento claro de las fuentes de datos, los destinos, las transformaciones, las dependencias, la propiedad, los derechos de acceso y las responsabilidades.
La aplicación de políticas de gobernanza de datos en múltiples entornos puede requerir la coordinación entre diferentes stakeholders, como propietarios de datos, administradores de datos, consumidores de datos y reguladores de datos.
El auge de los analytics de autoservicio y business intelligence presenta nuevos desafíos para la gobernanza de datos.
Las solicitudes de acceso de más usuarios llegan más rápido que antes, pero los equipos de gobernanza deben equilibrar la velocidad y la accesibilidad con las preocupaciones de privacidad y seguridad. Además, los sistemas y procedimientos de transmisión de datos deben ajustarse con precisión para evitar la fuga de datos.
Al proporcionar los datos que impulsan el entrenamiento y las operaciones de la IA, muchas herramientas de almacenamiento de datos resultan insuficientes.
Después de todo, la IA es intrínsecamente más compleja que los procesos y capacidades estándar impulsados por TI, lo que aumenta la importancia de una gobernanza de datos activa e informada. Un informe de KPMG destaca la brecha de gobernanza de la IA como uno de los principales riesgos que amenazan actualmente a las empresas.3 Por ejemplo, sin las barreras de seguridad adecuadas, la IA podría exponer inadvertidamente PII sensible o secretos corporativos.
Para reducir los riesgos y las complejidades de la IA, las organizaciones pueden combinar las capacidades de almacenamiento de datos optimizadas para IA con programas de gobernanza de datos diseñados teniendo en cuenta la IA.
La planificación y creación de un marco de gobernanza de datos requiere tiempo y esfuerzo entre múltiples stakeholders y equipos. Las prácticas comunes que utilizan las organizaciones al implementar programas de gobierno incluyen:
Automatizar ciertas partes del proceso de gobernanza de datos puede ayudar a mejorar la eficiencia y reducir errores. Las herramientas de gestión y gobernanza de datos pueden ayudar a automatizar tareas rutinarias como:
La seguridad de datos y los controles de acceso sólidos son fundamentales para cualquier marco de gobernanza de datos. Al mismo tiempo, las organizaciones quieren que el acceso a datos sea lo más fluido posible para aquellos con autorización para ver y utilizar conjuntos de datos específicos. Sin este fácil acceso a la información de autoservicio, la colaboración y los nuevos insights se ven obstaculizados.
Muchas organizaciones tienen dificultades para gestionar sus datos debido a la falta de visibilidad. Un catálogo de datos central puede funcionar como la única fuente de información, lo que permite la integración de datos y las iniciativas de gobernanza.
De acuerdo con un reporte de Gartner, la demanda de catálogos de datos está aumentando, mientras las organizaciones siguen teniendo dificultades para encontrar, inventariar y analizar activos de datos distribuidos y diversos. Con un catálogo de datos sólido, las organizaciones pueden localizar y clasificar con mayor facilidad la información a escala, lo que permite una mejor aplicación de las políticas de gobernanza de datos.
Muchas organizaciones encuentran útil crear una hoja de ruta clara de gobernanza. Los modelos de madurez pueden proporcionar esta hoja de ruta.
Un modelo de madurez de gobernanza de datos es una herramienta que ayuda a las organizaciones a evaluar el estado actual de su programa de gobierno de datos, establecer objetivos y realizar un seguimiento del progreso a lo largo del tiempo.
Las organizaciones pueden establecer mecanismos regulares de evaluación y presentación de informes para monitorear los datos y las métricas de gobernanza a lo largo del tiempo. Estas evaluaciones pueden ayudar a la organización a identificar problemas y realizar mejoras en los procesos de gobernanza.
Revisar periódicamente el marco y ajustarlo en función del feedback, las nuevas normativas o los cambios en la estrategia empresarial ayuda a que el marco siga siendo pertinente y eficaz.
Además, las evaluaciones pueden fomentar una cultura que valore los datos como un activo estratégico, al permitir la business intelligence y el uso eficaz de los datos en toda la organización.
1 IDC MarketScape: Worldwide AI Governance Platforms 2023 Vendor Assessment, IDC, 2023.
2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group by TechTarget, abril de 2023. (PDF).
3 Top risk forecast, KPMG, 2024.
Cree una base de datos controlados para acelerar los resultados de los datos y abordar los requisitos de privacidad y cumplimiento.
Prepárese para la Ley de IA de la UE y establezca un enfoque de gobernanza de la IA responsable con la ayuda de IBM Consulting.
Descubra el software de gobernanza de datos para el descubrimiento, la calidad y la protección.