Como líder de datos, sabe que obtener valor de los datos se reduce a proporcionar los datos correctos en el momento adecuado, independientemente de dónde residan. Esa capacidad depende de que disponga de una arquitectura de datos moderna como parte de su estrategia de datos.
Una arquitectura de datos adecuada traduce las necesidades empresariales en requisitos de datos y sistemas, y gestiona la protección y el flujo de datos a través de una organización. Hay que tener en cuenta que no se trata de una fórmula única y universal. El marco debe responder a las necesidades de la empresa y respaldar los objetivos a corto y largo plazo. "Los tiempos de una única arquitectura estructurada de datos en reposo han pasado a la historia", afirma Paul Christensen, arquitecto de élite de datos de IBM® Expert Labs. "Las empresas de hoy se rigen por datos en movimiento y en reposo, datos en muchas formas y datos en distintos grados de calidad y confianza".
Con los datos distribuidos más que nunca, tanto en local como en la nube, las soluciones de arquitectura de datos son esenciales para satisfacer las necesidades especializadas de la empresa, aplicar la analítica de datos y utilizar los datos y la IA a escala. Para la mayoría de las organizaciones actuales, una arquitectura de datos moderna no es solo una opción, sino una necesidad urgente.
¿Cómo se encuentran y determinan esas necesidades especializadas para seleccionar la tecnología adecuada? Una topología de datos le ayuda a clasificar y gestionar los escenarios del mundo real para construir una arquitectura de datos moderna que tenga en cuenta los usuarios, el uso, las restricciones y el flujo de datos y que sea altamente resistente a las necesidades futuras.
Descubra Watsonx
Regístrese para recibir actualizaciones sobre IA
El auge de la modernización de la nube no reducirá necesariamente la complejidad o el coste. Tampoco eliminará los silos de datos, ni gestionará el gobierno o la conformidad. De hecho, los estudios demuestran que el 68 % de los datos no se utilizan¹.
Es aquí donde entra la data fabric, un método arquitectónico para simplificar el acceso a datos y facilitar el autoconsumo de datos para una mejor toma de decisiones. Una data fabric incluye los controles apropiados para dar soporte a los flujos de datos necesarios, los procesos y los consumidores de esos datos dentro de una organización. Esta moderna arquitectura de datos allana el camino para la integración de extremo a extremo de varias canalizaciones de datos y entornos de nube mediante capacidades inteligentes y automatizadas.
La base de una data fabric son los metadatos activos federados, a los que a menudo se hace referencia como los datos que describen los datos. Las bases o fuentes de datos y los objetivos también son componentes clave. Estas fuentes deben seleccionarse en función de su capacidad para soportar cualquier carga de trabajo necesaria, ya sea de procesamiento transaccional, operativo o híbrido transaccional y analítico, y que implique IA, inteligencia empresarial, elaboración de informes o analítica avanzada.
"Los clientes pueden disponer de hasta nueve tipos de bases de datos diferentes, con muchas instancias cada una. Una data fabric pone orden en los silos y la fragmentación de datos que los clientes intentan gestionar", afirma Edward Calvesbert, lider de producto de la cartera de bases de datos de IBM.
A través de una capa de virtualización, una data fabric reúne datos en tiempo real de múltiples fuentes, incluidos sistemas existentes, bases de datos, data lakes, almacenes de datos, repositorios edge y en memoria. Estas fuentes pueden ejecutar cargas de trabajo transaccionales, operativas o analíticas y almacenar tipos de datos estructurados y no estructurados. Esta orquestación proporciona un alcance centralizado en todos los puntos de su entorno de datos.
Con estas capacidades de extremo a extremo, una estructura de datos ayuda a garantizar que los datos de varias fuentes se puedan combinar, acceder y gestionar correctamente para que los usuarios empresariales y los científicos, ingenieros y analistas de datos puedan poner los datos a trabajar. También permite la innovación a escala en áreas como la IA al proporcionar conjuntos de datos controlados para alimentar sus aplicaciones de IA.
Ya hemos hablado de la data fabric. Pero, ¿qué hay de la data mesh, otro método que racionaliza el uso de los datos en toda la empresa en una arquitectura basada en datos?
Data fabric y data mesh son dos conceptos relativos a la arquitectura de datos. Cada uno de ellos sigue un diseño basado en casos prácticos y trata de resolver los retos de la dispersión, el gobierno y la disponibilidad de los datos. Los métodos de data fabric y data mesh también se basan en la detección continua de los datos y en catálogos de conocimiento de datos de autoservicio. La buena noticia es que estos conceptos de arquitectura de datos son complementarios.
¿Las diferencias? Las arquitecturas de data mesh son específicas de cada dominio e independientes de la tecnología y están diseñadas para casos prácticos analíticos. En comparación, las arquitecturas de data fabric están diseñadas para casos prácticos tanto operativos como analíticos. Mientras que la data fabric proporciona una visión unificada de todos los activos de datos, el almacenamiento de datos reales puede estar descentralizado, centralizado o ser una mezcla de ambos. Asimismo, las arquitecturas de data fabric admiten múltiples estructuras organizativas, desde las federadas hasta las distribuidas. Por último, las arquitecturas de data fabric utilizan tecnologías de inteligencia artificial y machine learning para automatizar la detección de datos, su clasificación y la aplicación de políticas.
Ahora que ha visto el potencial de una arquitectura de tejido de datos, explore estos casos prácticos para delimitar el área de enfoque que mejor se adapte a los objetivos de su organización.
1 Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF, enlace externo a ibm.com), Seagate Technology, julio de 2020.
2 Data Integrity Trends: Chief Data Officer Perspectives in 2021 (enlace externo a ibm.com). Corinium, 18 de junio de 2021.