En tant que responsable des données, vous savez que pour tirer parti des données, il faut fournir les bonnes données au bon moment, quel que soit l’endroit où elles se trouvent. Cette capacité dépend de la mise en place d’une architecture de données moderne dans le cadre de votre stratégie de données.
Une architecture de données adaptée traduit les besoins de l’entreprise en exigences en matière de données et de systèmes, et gère la protection et le flux de données au sein d’une organisation. Gardez à l’esprit qu’il ne s’agit pas d’une formule unique. Le cadre doit être déterminé par les besoins de l’entreprise et soutenir les objectifs à court et à long terme. « L’époque d’une architecture des données au repos, unique et structurée est révolue », a déclaré Paul Christensen, architecte de l’élite des données, expert IBM Labs. « Les entreprises d’aujourd’hui sont guidées par des données en mouvement et au repos, qui se présentent sous de nombreuses formes et dont la qualité et la fiabilité varient.
Les données étant plus que jamais distribuées sur site et dans le cloud, les solutions d’architecture de données sont essentielles pour répondre aux besoins spécifiques de l’entreprise, appliquer l’analytique des données et utiliser les données et l’IA à grande échelle. Pour la plupart des organisations aujourd’hui, une architecture de données moderne n’est pas seulement une option, c’est une nécessité urgente.
Comment trouver et déterminer ces besoins spécialisés pour sélectionner la bonne technologie ? Une topologie des données vous aide à classer et à gérer des scénarios concrets pour construire une architecture de données moderne qui prend en compte les utilisateurs, l’utilisation, les contraintes et le flux de données, et qui est hautement adaptée aux besoins futurs.
Voici watsonx
S’inscrire pour recevoir les dernières informations sur l’IA
L’essor de la modernisation de cloud ne réduira pas nécessairement la complexité ou les coûts, ne supprimera pas les silos de données et ne gérera pas la gouvernance et la conformité. En fait, des études montrent que 68 % des données ne sont pas utilisées¹.
C’est là que la data fabric entre en jeu. La data fabric est une approche architecturale qui vise à simplifier l’accès aux données et à faciliter l’utilisation des données en fonction de ses besoins pour une meilleure prise de décision. La data fabric comprend les contrôles appropriés pour soutenir les flux de données, les processus et les consommateurs de ces données au sein d’une organisation. Cette architecture de données moderne facilite l’intégration de bout en bout des différents pipelines de données et des environnements cloud grâce à des capacités intelligentes et automatisées.
Les métadonnées actives fédérées, souvent qualifiées de « données qui décrivent les données », constituent la base de la data fabric. Les bases de données ou les cibles et les sources de données sont également des éléments clés. Ces sources doivent être sélectionnées en fonction de leurs capacités à prendre en charge le workload requis, qu’il s’agisse d’un traitement transactionnel, opérationnel ou hybride, transactionnel et analytique, impliquant l’IA, la Business Intelligence, la création de rapports ou l’analytique avancée.
« Les clients peuvent avoir jusqu’à neuf types de bases de données différentes, et de nombreuses instances de chacune d’entre elles. Une data fabric met de l’ordre dans les silos de données et la fragmentation des données que les clients essaient de gérer », explique Edward Calvesbert, chef de produit pour le portefeuille de bases de données chez IBM.
Grâce à une couche de virtualisation, la data fabric rassemble des données en temps réel provenant de sources multiples, y compris des systèmes existants, des bases de données, des data lakes, des entrepôts de données et des référentiels edge et en mémoire. Ces sources peuvent exécuter des workloads transactionnels, opérationnels ou analytiques et stocker des types de données structurés ou non structurés. Cette orchestration permet d’accéder à tous les points de votre paysage de données de manière centralisée.
Grâce à ces capacités de bout en bout, la data fabric permet à vos données provenant de diverses sources d’être combinées, consultées et gérées avec succès afin que les utilisateurs professionnels, les data scientists, les ingénieurs en traitement des données et les analystes des données puissent en tirer parti. Elle permet également d’innover à grande échelle dans des domaines tels que l’IA en fournissant des ensembles de données gouvernées pour alimenter vos applications d’IA.
Nous avons parlé de la data fabric. Mais qu’en est-il du data mesh, une autre approche qui rationalise l’utilisation des données à l’échelle de l’entreprise dans le cadre d’une architecture fondée sur les données ?
La data fabric et le data mesh sont deux concepts d’architecture de données. Chacun repose sur une conception basée sur le cas d’utilisation et cherche à résoudre les problèmes liés à la prolifération, la gouvernance et la disponibilité des données. Les approches de la data fabric et du data mesh s’appuient toutes deux sur la découverte permanente de données et sur des catalogues de connaissances des données en libre-service. Heureusement, ces concepts d’architecture de données sont complémentaires.
Quelles sont les différences ? Les architectures data mesh sont spécifiques à un domaine et compatibles avec toutes les technologies. Elles sont conçues pour des cas d’utilisation analytiques. En comparaison, les architectures data fabric sont conçues pour des cas d’utilisation à la fois opérationnels et analytiques. Alors que la data fabric fournit une vue unifiée de toutes les données actives, le stockage réel des données peut être décentralisé, centralisé ou les deux. De même, les architectures data fabric prennent en charge de multiples structures organisationnelles, qu’elles soient fédérées ou distribuées. Enfin, les architectures data fabric utilisent l’intelligence artificielle et le machine learning pour automatiser la découverte de données, la classification des données et l’application des politiques.
Maintenant que vous avez vu le potentiel d’une architecture data fabric, explorez ces cas d’utilisation afin de déterminer le meilleur domaine d’action pour atteindre les objectifs de votre organisation.
1 Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF, lien externe à ibm.com), Seagate Technology, juillet 2020.
2 Data Integrity Trends: Chief Data Officer Perspectives in 2021 (lien externe à ibm.com). Corinium, le 18 juin 2021.