La integridad de los datos es la garantía de que los datos de una organización son precisos, completos y coherentes en cualquier momento de su ciclo de vida. Mantener la integridad de los datos implica proteger los datos de una organización contra pérdidas, filtraciones e influencias corruptoras.
Las organizaciones confían en los datos limpios para la toma de decisiones, predecir el comportamiento de los consumidores, evaluar las tendencias del mercado y protegerse contra las vulneraciones de datos. A medida que los volúmenes de datos dentro de las organizaciones se disparan y esos datos se utilizan para tomar decisiones sobre el futuro de la empresa, maximizar la integridad de los datos se vuelve cada vez más importante.
Para lograr la integridad de los datos, las organizaciones se adhieren a procesos que incluyen la comprobación de errores, procedimientos de validación y estrictas medidas de seguridad como el cifrado, el control de acceso y las copias de seguridad. El objetivo de la integridad de los datos es ayudar a garantizar que los análisis de datos se basen en información fiable respaldada por marcos normativos como el RGPDy que la información confidencial esté protegida contra el acceso no autorizado o la explotación.
La integridad de los datos no se limita a una única herramienta o plataforma, sino que es un enfoque global que implica el esfuerzo colectivo de la infraestructura tecnológica de una organización, las políticas y las personas que trabajan con el sistema de datos para garantizar que los datos sigan siendo un activo fiable.
Boletín del sector
Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
La integridad de los datos es similar al control de calidad en las empresas tradicionales orientadas al producto y garantiza que la materia prima es correcta, segura y adecuada para el uso previsto.
Confiar en datos de calidad en el análisis empresarial, las interacciones con los clientes y el cumplimiento pone de relieve la importancia de la integridad de los datos en toda la organización. El adagio "basura entra, basura sale" es muy pertinente cuando se utilizan datos para fundamentar decisiones empresariales acertadas, tratar a los clientes de forma justa y correcta y facilitar informes empresariales precisos que cumplan la normativa del sector. Los datos erróneos, una vez operacionalizados, conducen a resultados indeseables.
Las organizaciones necesitan mantener los datos completos, precisos, coherentes y seguros a lo largo de su ciclo de vida. La integridad de los datos ayuda a promover esta exhaustividad manteniendo intactos todos los elementos de los datos, sin alteraciones, truncamientos ni pérdidas, y evitando cambios que podrían distorsionar el análisis y poner en peligro la coherencia de las condiciones de las pruebas. Sin procesos de integridad de los datos, las organizaciones no podrían comprobar que los datos futuros coinciden con los datos del pasado, independientemente de los patrones de acceso. Además, la integridad de los datos sirve para reforzar la seguridad de datos mediante el control del acceso y la protección contra la explotación no autorizada a través de la autenticación, la autorización, el cifrado y las estrategias integrales de protección de datos, incluidas las copias de seguridad y la información de registro de acceso.
Más allá de la toma de decisiones, la integridad de los datos es crucial para proteger la información personal y sensible de los interesados. Los errores en el tratamiento de los datos de los clientes, ya sea por errores humanos o por ciberataques, pueden dar lugar a vulneraciones de la privacidad y la confianza, a la tergiversación de las personas y a daños potencialmente graves para la reputación. Esto es igualmente cierto para los datos de primera mano menos sensibles, donde las imprecisiones pueden sesgar la comprensión y el trato de la empresa a sus usuarios, afectando su inclusión en las tendencias e interacciones con la marca. Por lo tanto, mantener la integridad de los datos no es simplemente una cuestión de cumplimiento u operativa, sino un imperativo estratégico que afecta a todas las facetas de la relación de una organización con sus clientes y su posición en el mercado.
El concepto fundamental de la integridad de los datos consiste en garantizar la usabilidad del conjunto de datos para fines básicos de análisis empresarial. Sustenta la estabilidad, el rendimiento, la capacidad de recuperación y la seguridad de los datos.
El problema es que los datos pueden verse comprometidos de varias formas: por errores humanos, errores involuntarios de transferencia, virus, fallos de software, malware, piratería informática, hardware defectuoso y daños físicos en los dispositivos. Las organizaciones pueden lograr la integridad empleando restricciones de integridad y definiendo las normas y procedimientos en torno al trabajo con los datos. Las restricciones de integridad cubren acciones como la eliminación, la inserción y la alteración de la información, lo que permite aplicar la integridad en sistemas comunes como las bases de datos de planificación de recursos empresariales (ERP), los sistemas de gestión de la relación con el cliente (CRM) y los sistemas de gestión de la cadena de suministro.
Cinco tipos de integridad de datos ayudan a las organizaciones a verificar y mantener la calidad de sus datos:
Una característica de los sistemas de bases de datos relacionales que almacena datos dentro de tablas, que se pueden usar y vincular de varias maneras. La integridad de la entidad se basa en claves y valores únicos creados para identificar los datos, lo que garantiza que los mismos datos no aparezcan en la lista varias veces y que los campos de la tabla se rellenen correctamente.
Protege la exactitud, corrección e integridad de los datos mientras se almacenan y recuperan. La integridad física puede verse comprometida por cortes de electricidad, erosión del almacenamiento, hackers y desastres naturales.
Una serie de procesos que garantizan que los datos se almacenen y utilicen de manera uniforme. Las estructuras de bases de datos incorporan reglas que imponen la presencia de registros coincidentes en las tablas vinculadas, lo que evita los registros huérfanos y mantiene la coherencia de los datos en toda la base de datos.
Un dominio está definido por un conjunto específico de valores para las columnas de una tabla, incluidas las restricciones y reglas que rigen la cantidad, el formato y los datos que pueden introducirse. La integridad del dominio ayuda a garantizar la precisión de los elementos de datos dentro de un dominio.
Cuando los usuarios crean reglas y restricciones en torno a los datos para alinearlos con sus especificaciones únicas. Este método se emplea generalmente con otros procesos que no garantizan la seguridad de los datos.
La integridad de los datos, la calidad de los datos y la seguridad de los datos son conceptos fundamentales en la gestión de datos empresariales y, a menudo, se utilizan indistintamente de manera errónea.
La calidad de los datos se centra en las condiciones de los datos en función de factores como la exactitud, la exhaustividad, la unicidad y la actualidad.
La seguridad de los datos aborda la protección de datos contra el acceso no autorizado, las infracciones y otras formas de mala conducta. Abarca las tecnologías, políticas y prácticas implementadas para salvaguardar los datos a lo largo de su ciclo de vida, garantizando que sólo el personal autorizado pueda acceder a la información sensible para mantener la confidencialidad y la confianza.
La integridad de los datos es el principio general que incluye elementos de calidad y seguridad de los datos. Sirve para verificar la precisión y la coherencia de los datos a lo largo de todo su ciclo de vida, desde la creación y el almacenamiento hasta la recuperación y la eliminación, mediante la aplicación de reglas y estándares que evitan la alteración no autorizada de los datos. Los mecanismos de integridad de los datos ayudan a garantizar que éstos no sólo son correctos y accesibles, sino que también están protegidos contra manipulaciones no autorizadas, lo que favorece el cumplimiento de las normativas industriales y gubernamentales.
La integridad de los datos preocupa a todos los sectores, cada uno de los cuales adopta prácticas y normas únicas para salvaguardar sus datos. El sector farmacéutico debe adherirse a estrictas directrices establecidas por organismos reguladores como la Administración de Alimentos y Medicamentos de Estados Unidos (FDA). El borrador de las directrices de la FDA para los fabricantes farmacéuticos hace hincapié en el cumplimiento de los códigos y las regulaciones federales para certificar que los medicamentos se producen de manera consistente y son trazables, seguros para el consumo y eficaces. Del mismo modo, normas internacionales como la ISO 13485 para dispositivos médicos subrayan la importancia global de la integridad de los datos en la fabricación, garantizando que los productos cumplen las normas de seguridad y calidad más exigentes.
En el sector financiero, la Autoridad Reguladora de la Industria Financiera (FINRA) ha reconocido la necesidad de medidas sólidas de integridad de datos, particularmente en los sistemas automatizados de vigilancia de operaciones y movimientos de dinero. Las iniciativas de la FINRA para desarrollar y ampliar los programas de integridad de datos reflejan un esfuerzo más amplio de la industria para proteger las transacciones financieras y la información confidencial de los clientes, lo cual es crucial para mantener la confianza y el cumplimiento en un entorno fuertemente regulado.
También los sectores minero y de fabricación de productos prestan cada vez más atención a la integridad de los datos en sus sistemas de automatización y control de la producción. El objetivo es garantizar que los datos que impulsan las decisiones operativas y las mejoras de eficiencia sean precisos y fiables, para evitar errores costosos y aumentar la competitividad.
Los proveedores de bases de datos de almacenamiento en la nube se enfrentan a desafíos únicos para mantener la integridad y la procedencia de los datos de los clientes. Con la creciente dependencia de los servicios cloud para el almacenamiento y procesamiento de datos, estos proveedores deben aplicar medidas sofisticadas para rastrear y prevenir las violaciones de datos, garantizando que la información de sus clientes permanezca segura e inalterada.
Entre los ejemplos concretos de aplicaciones de integridad de datos se incluye también la sanidad, donde los errores en los historiales médicos electrónicos pueden tener consecuencias nefastas. En el ámbito financiero, la precisión de los datos de las transacciones es fundamental para la evaluación de riesgos y la detección de fraudes, y prácticas como los protocolos de conocimiento del cliente (KYC) desempeñan un papel crucial en la verificación de la información de los clientes y el mantenimiento del cumplimiento normativo. Las instituciones educativas dependen de registros precisos de los estudiantes para la gestión de la matrícula, el seguimiento académico y la asignación de recursos.
Garantizar la integridad de los datos en las organizaciones empresariales no es una tarea puntual, sino un esfuerzo continuo que requiere una estrategia holística en la que intervengan la tecnología, los procesos y las personas para validar los datos al máximo. Las siguientes estrategias y mejores prácticas protegen los activos de datos y permiten a las organizaciones aprovechar los datos con confianza para la toma de decisiones y la innovación.
La aplicación de controles de integridad de los datos lo más cerca posible del punto de entrada de los mismos (por ejemplo, una persona en un teclado o una aplicación que transmite datos) limita y especifica el tipo de información que puede entrar en la base de datos.
La gran variedad de vulnerabilidades de los datos subraya la importancia de un enfoque integral para proteger los datos. La gestión de la integridad de los datos en toda una organización se lleva a cabo mediante un amplio espectro de políticas, directrices y normas denominadas restricciones de integridad, que abarcan los diversos aspectos de la gestión de datos, desde la conservación hasta las relaciones entre los distintos datos y las personas que trabajan con ellos.
Las restricciones de integridad están vinculadas a los tipos de modelos de datos relacionales: entidad, referencial, dominio y definido por el usuario. Por ejemplo, las restricciones de dominio limitan el tipo de valores que puede contener una columna, por lo que es factible que una columna "antiguedad" sólo acepte enteros entre 1 y 120.
La integridad de la entidad proporciona instrucciones para que cada fila de una tabla sea única e identificable, normalmente aplicadas por una clave primaria, lo que significa que hay un identificador único para cada fila de una tabla de base de datos.
Las restricciones de integridad también garantizan que las relaciones entre tablas estén claramente definidas y se mantengan mediante claves externas, que son columnas o conjuntos de columnas de una tabla que hacen referencia a la clave primaria de otra tabla.
Estas restricciones confirman que los datos de cada campo se adhieren a los formatos y valores especificados y que se cumplen las reglas adicionales adaptadas a las necesidades específicas de la organización.
Las directrices y políticas de conservación especifican durante cuánto tiempo deben almacenarse los datos en una base de datos para garantizar su coherencia y minimizar los errores derivados de información antigua. Las copias de seguridad de los datos pueden proteger contra la pérdida de datos y proporcionar una protección contra fallos en el sistema, daños en los datos u otros incidentes imprevistos que puedan comprometer la integridad de los datos. Las estrategias de copia de seguridad eficaces deben incluir instantáneas periódicas de los datos almacenados en ubicaciones seguras y geográficamente dispersas para confirmar que los datos pueden restaurarse con una pérdida mínima.
La conectividad y el acceso a los datos también desempeñan un papel fundamental en el mantenimiento de la integridad de los datos. Garantizar una conectividad perfecta entre diferentes fuentes de datos y sistemas permite un flujo constante de información en toda la organización.
La gestión del acceso a los datos ayuda a garantizar que sólo el personal autorizado pueda modificarlos o interactuar con ellos para reducir el riesgo de manipulación accidental o malintencionada.
Además, la vigilancia continua en toda la organización también ayuda a mantener la integridad de los datos. Es importante comprobar periódicamente los errores, concienciar sobre la ciberseguridad y comunicar claramente entre los miembros del equipo la importancia de tener datos precisos.
Las organizaciones deben garantizar la integridad física de los datos mediante medidas como fuentes de alimentación ininterrumpida y hardware redundante.
Una vez recopilados los datos, unas prácticas sólidas de gestión de bases de datos pueden aplicar reglas que impidan la creación de datos duplicados. Aprovechar la tecnología como las herramientas de linaje de datos, que rastrean el origen y las transformaciones de los datos, para las pruebas de auditoría, los catálogos de datos que ofrecen características de seguridad de control de acceso, los rigurosos procesos de validación de entradas y un moderno sistema de bases de datos para ayudar a prevenir las infracciones de la integridad.
Los sistemas de bases de datos vienen equipados con funciones que admiten restricciones de integridad, descargando la responsabilidad de comprobar la exactitud a la propia base de datos. Por ejemplo, mecanismos como las relaciones padre-hijo ilustran cómo los procesos de integridad referencial gestionados a nivel de base de datos pueden salvaguardar automáticamente la integridad de los datos, ayudando a garantizar que se conservan las relaciones entre registros, evitando registros huérfanos y eliminaciones no autorizadas.
Las herramientas de validación de datos como IBM Databand y Ataccama son un paso esencial para lograr precisión, consistencia e integridad. Las herramientas de validación ayudan a identificar discrepancias o anomalías que podrían indicar problemas. Una vez integradas en un sistema de gestión de datos, estas herramientas verifican continuamente la calidad e integridad de los datos.
Este enfoque centralizado ayuda a mantener estables los sistemas de gestión de datos, al tiempo que garantiza la reutilización y el fácil mantenimiento de los datos en diferentes aplicaciones.
Una empresa deseosa de fomentar una cultura que priorice la precisión y la seguridad de los datos debe educar a los líderes empresariales y a los empleados sobre los riesgos de utilizar datos inseguros o incorrectos.
Cree y gestione canalizaciones de datos de streaming inteligentes a través de una interfaz gráfica intuitiva, y facilite una integración de datos fluida en entornos híbridos y multinube.
Watsonx.data le permite escalar la analítica y la IA con todos sus datos, residan donde residan, a través de un almacén de datos abierto, híbrido y gobernado.
Desbloquee el valor de los datos empresariales con IBM Consulting, y construya una organización impulsada por conocimientos que ofrezca ventajas empresariales.