Como líder de datos, sabe que aprovechar el valor de los datos se trata de proporcionar los datos correctos en el momento indicado, independientemente de dónde residan. Esa capacidad se basa en tener implementada una arquitectura de datos moderna como parte de su estrategia de datos.
Una arquitectura de datos adecuada para su propósito traduce las necesidades comerciales en requisitos de datos y sistemas y gestiona la protección y el flujo de datos de toda una organización. Tenga en cuenta que no hay una fórmula única que sirva para todos. El marco debe estar impulsado por los requisitos comerciales y ser funcional para los objetivos a corto y largo plazo. "Atrás quedaron los días de una arquitectura de datos estáticos única y estructurada", dice Paul Christensen, arquitecto de datos de elite de IBM Expert Labs. "Actualmente, las empresas están impulsadas por datos dinámicos y estáticos, datos en muchos formatos y datos con distintos grados de calidad y confianza".
Con datos distribuidos más que nunca, tanto on premises como en la nube, las soluciones de arquitectura de datos son esenciales para satisfacer las necesidades especializadas de la empresa, aplicar data analytics y la IA a escala. Para la mayoría de las organizaciones actuales, una arquitectura de datos moderna no es una opción más, sino una necesidad urgente.
¿Cómo encontrar y determinar cuáles son esas necesidades especiales para seleccionar la tecnología adecuada? Una topología de datos permite clasificar y administrar los escenarios del mundo real para crear una arquitectura de datos moderna que tenga en cuenta a los usuarios, el uso, las limitaciones y el flujo de datos y que sea muy resiliente a necesidades futuras.
El aumento de la modernización de la nube no necesariamente reducirá la complejidad o el costo, eliminará los silos de datos ni gestionará la gobernanza y el cumplimiento. De hecho, las investigaciones demuestran que el 68 % de los datos no se usan.¹
Conozca el tejido de datos, un enfoque arquitectónico para simplificar el acceso a los datos y facilitar el consumo de datos de autoservicio para tomar decisiones de mejor manera. Un tejido de datos incluye los controles adecuados para respaldar los flujos de datos necesarios, los procesos y los consumidores de esos datos dentro de una organización. Esta arquitectura de datos moderna allana el camino para la integración de extremo a extremo de distintos canales de datos y entornos de nube a través de capacidades inteligentes y automatizadas.
La base de un tejido de datos son los metadatos activos federados, que a menudo se conocen como "los datos que describen datos". Las bases de datos o las fuentes de datos y los objetivos también son componentes clave. Esas fuentes deben seleccionarse según sus capacidades para respaldar la carga de trabajo que se requiera, ya sea transaccional, operativa o híbrida entre transaccional y de procesamiento analítico, y que involucre IA, business intelligence, generación de informes o analítica avanzada.
"Los clientes pueden tener hasta nueve tipos de bases de datos diferentes y muchas instancias de cada una. Un tejido de datos aporta orden a los silos de datos y los datos fragmentados que los clientes intentan gestionar", dice Edward Calvesbert, director de producto para la cartera de bases de datos de IBM.
A través de una capa de virtualización, un tejido de datos reúne, en tiempo real, datos de múltiples fuentes, incluidos los sistemas existentes, las bases de datos, los lagos de datos, los almacenes de datos y los repositorios perimetrales y en memoria. Estas fuentes pueden ejecutar cargas de trabajo transaccionales, operativas o analíticas y almacenar tipos de datos estructurados y no estructurados. Esta orquestación ofrece un alcance centralizado a todos los puntos de su estructura de datos.
Con estas capacidades de extremo a extremo, un tejido de datos ayuda a garantizar que los datos provenientes de distintas fuentes puedan combinarse, verse y gobernarse correctamente para que los usuarios de negocios y los científicos, ingenieros y analistas de datos puedan ponerlos a trabajar. También permite la innovación a escala en áreas tales como la IA, dado que proporcionan conjuntos de datos gobernados para alimentar las aplicaciones de IA.
Hemos hablado del tejido de datos. Pero ¿qué pasa con la malla de datos, otro enfoque que optimiza el uso empresarial de los datos en una arquitectura impulsada por datos?
El tejido y la malla son dos conceptos de arquitectura de datos. Cada uno sigue un diseño impulsado por caso de uso y busca resolver los desafíos de la proliferación, la gobernanza y la disponibilidad de los datos. Ambos enfoques dependen del continuo descubrimiento de datos y de los catálogos de conocimiento de datos de autoservicio. La buena noticia es que estos conceptos de arquitectura son complementarios.
¿Las diferencias? La arquitectura de malla de datos es específica del dominio e independiente en cuanto a la tecnología, diseñada para casos de uso analíticos. En contraste, las arquitecturas de tejido de datos están diseñadas tanto para casos de uso analíticos como operativos. Aunque el tejido de datos ofrece una visión unificada de todos los activos de datos, el almacenamiento de datos real puede estar descentralizado, centralizado o una combinación de ambas opciones. Asimismo, las arquitecturas de tejido de datos respaldan múltiples estructuras organizacionales, desde las federadas hasta las distribuidas. Finalmente, las arquitecturas de tejido de datos usan tecnologías de inteligencia artificial y aprendizaje automático para automatizar el descubrimiento y la clasificación de datos y la aplicación de políticas.
Ahora que ha visto el potencial de la arquitectura de tejido de datos, explore estos casos de uso para encontrar la mejor área de enfoque y satisfacer los objetivos de su organización.
1 Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF, enlace externo a ibm.com). Seagate Technology, julio de 2020.
2 Data Integrity Trends: Chief Data Officer Perspectives in 2021 (enlace externo a ibm.com). Corinium, 18 de junio de 2021.