Créer une architecture de données moderne

Avoir une architecture de données adaptée est un impératif pour les entreprises

En tant que responsable des données, vous savez que pour tirer parti des données, il faut fournir les bonnes données au bon moment, quel que soit l’endroit où elles se trouvent. Cette capacité dépend de la mise en place d’une architecture de données moderne dans le cadre de votre stratégie de données.

Une architecture de données adaptée traduit les besoins de l’entreprise en exigences en matière de données et de systèmes, et gère la protection et le flux de données au sein d’une organisation. Gardez à l’esprit qu’il ne s’agit pas d’une formule unique. Le cadre doit être déterminé par les besoins de l’entreprise et soutenir les objectifs à court et à long terme. « L’époque d’une architecture des données au repos, unique et structurée est révolue », a déclaré Paul Christensen, architecte de l’élite des données, expert IBM Labs. « Les entreprises d’aujourd’hui sont guidées par des données en mouvement et au repos, qui se présentent sous de nombreuses formes et dont la qualité et la fiabilité varient.

Les données étant plus que jamais distribuées sur site et dans le cloud, les solutions d’architecture de données sont essentielles pour répondre aux besoins spécifiques de l’entreprise, appliquer l’analytique des données et utiliser les données et l’IA à grande échelle. Pour la plupart des organisations aujourd’hui, une architecture de données moderne n’est pas seulement une option, c’est une nécessité urgente.

Comment trouver et déterminer ces besoins spécialisés pour sélectionner la bonne technologie ? Une topologie des données vous aide à classer et à gérer des scénarios concrets pour construire une architecture de données moderne qui prend en compte les utilisateurs, l’utilisation, les contraintes et le flux de données, et qui est hautement adaptée aux besoins futurs.

Lire les autres chapitres

Voici watsonx

S’inscrire pour recevoir les dernières informations sur l’IA

Principales caractéristiques d’une architecture de données moderne

Conçue pour être flexible et extensible afin que les données restent gérables

Intègre des silos de données et des domaines distribués, par exemple entre des départements ou des zones géographiques, physiquement ou virtuellement

Utilise des plateformes multicloud hybrides pour gérer et traiter les données

Gère les volumes de données croissants grâce à l’évolutivité du calcul et du stockage

Automatise l’intégration des données, l’ingénierie du traitement des données et la gouvernance dans une chaîne de valeur entre les fournisseurs de données et les consommateurs

Intègre la sécurité, l’évolutivité et l’adaptabilité à tous les niveaux

Pourquoi une architecture data fabric ?

L’essor de la modernisation de cloud ne réduira pas nécessairement la complexité ou les coûts, ne supprimera pas les silos de données et ne gérera pas la gouvernance et la conformité. En fait, des études montrent que 68 % des données ne sont pas utilisées¹.

C’est là que la data fabric entre en jeu. La data fabric est une approche architecturale qui vise à simplifier l’accès aux données et à faciliter l’utilisation des données en fonction de ses besoins pour une meilleure prise de décision. La data fabric comprend les contrôles appropriés pour soutenir les flux de données, les processus et les consommateurs de ces données au sein d’une organisation. Cette architecture de données moderne facilite l’intégration de bout en bout des différents pipelines de données et des environnements cloud grâce à des capacités intelligentes et automatisées.

Les métadonnées actives fédérées, souvent qualifiées de « données qui décrivent les données », constituent la base de la data fabric. Les bases de données ou les cibles et les sources de données sont également des éléments clés. Ces sources doivent être sélectionnées en fonction de leurs capacités à prendre en charge le workload requis, qu’il s’agisse d’un traitement transactionnel, opérationnel ou hybride, transactionnel et analytique, impliquant l’IA, la Business Intelligence, la création de rapports ou l’analytique avancée.

« Les clients peuvent avoir jusqu’à neuf types de bases de données différentes, et de nombreuses instances de chacune d’entre elles. Une data fabric met de l’ordre dans les silos de données et la fragmentation des données que les clients essaient de gérer », explique Edward Calvesbert, chef de produit pour le portefeuille de bases de données chez IBM.

Grâce à une couche de virtualisation, la data fabric rassemble des données en temps réel provenant de sources multiples, y compris des systèmes existants, des bases de données, des data lakes, des entrepôts de données et des référentiels edge et en mémoire. Ces sources peuvent exécuter des workloads transactionnels, opérationnels ou analytiques et stocker des types de données structurés ou non structurés. Cette orchestration permet d’accéder à tous les points de votre paysage de données de manière centralisée.

Grâce à ces capacités de bout en bout, la data fabric permet à vos données provenant de diverses sources d’être combinées, consultées et gérées avec succès afin que les utilisateurs professionnels, les data scientists, les ingénieurs en traitement des données et les analystes des données puissent en tirer parti. Elle permet également d’innover à grande échelle dans des domaines tels que l’IA en fournissant des ensembles de données gouvernées pour alimenter vos applications d’IA.

Illustration de l’architecture des données

Télécharger le PDF

Explorer la data fabric

Une data fabric est développée dans un domaine particulier et conçue pour répondre aux besoins en données spécialisées des utilisateurs, des personas et des appareils. Elle maximise la conservation des données et le placement des workloads (les doublons non gérés doivent être évités) et optimise et réduit le mouvement des données, améliorant ainsi le flux de données pour les utilisateurs finaux. Découvrez comment cette approche architecturale simplifie l’accès aux données dans votre organisation.

Data fabric ou data mesh ?

Nous avons parlé de la data fabric. Mais qu’en est-il du data mesh, une autre approche qui rationalise l’utilisation des données à l’échelle de l’entreprise dans le cadre d’une architecture fondée sur les données ?

La data fabric et le data mesh sont deux concepts d’architecture de données. Chacun repose sur une conception basée sur le cas d’utilisation et cherche à résoudre les problèmes liés à la prolifération, la gouvernance et la disponibilité des données. Les approches de la data fabric et du data mesh s’appuient toutes deux sur la découverte permanente de données et sur des catalogues de connaissances des données en libre-service. Heureusement, ces concepts d’architecture de données sont complémentaires.

Quelles sont les différences ? Les architectures data mesh sont spécifiques à un domaine et compatibles avec toutes les technologies. Elles sont conçues pour des cas d’utilisation analytiques. En comparaison, les architectures data fabric sont conçues pour des cas d’utilisation à la fois opérationnels et analytiques. Alors que la data fabric fournit une vue unifiée de toutes les données actives, le stockage réel des données peut être décentralisé, centralisé ou les deux. De même, les architectures data fabric prennent en charge de multiples structures organisationnelles, qu’elles soient fédérées ou distribuées. Enfin, les architectures data fabric utilisent l’intelligence artificielle et le machine learning pour automatiser la découverte de données, la classification des données et l’application des politiques.  

Découvrez les trois façons dont la data fabric permet la mise en œuvre d’un data mesh

Si vous voulez créer une culture dans laquelle les personnes travaillent avec des données, consomment des données et prennent des décisions basées sur des données, vous devez commencer par rendre les données facilement accessibles. Ferd Scheepers

Architecte en chef de l’IA

ING

Commencez par un cas d’utilisation

Maintenant que vous avez vu le potentiel d’une architecture data fabric, explorez ces cas d’utilisation afin de déterminer le meilleur domaine d’action pour atteindre les objectifs de votre organisation.

Gouvernez et protégez vos données

Améliorez la qualité des données et rendez les bonnes données plus faciles à trouver.

Lire l’eBook

IA générative et ML au service des entreprises

Découvrez le principal avantage et les étapes suivantes de l’intégration de l’IA générative et du machine learning dans votre entreprise.

Lire l’eBook

Connectez les données dans l’ensemble des silos

Démocratisez l’accès aux données dans les environnements de cloud hybride.

Lire l’eBook

Simplifiez la construction et le déploiement des modèles

Faites évoluer l’IA dans les environnements cloud grâce à la science des données et aux MLOps.

Lire l’eBook

Par où commencer ?

Apprenez à construire une base de données solide pour développer et gouverner l’IA d’entreprise.

Lire le nouveau chapitre

Etapes suivantes

Lire les autres chapitres

Voici watsonx

Explorez la nouvelle plateforme d’IA et de données d’IBM adaptée aux entreprises. Elle est conçue pour décupler l’impact de l’IA dans l’ensemble de votre entreprise.

Découvrir la solution

Parlons-en

Discutez avec un expert de la manière de mettre les données et l’IA au service de votre entreprise.

S’inscrire pour recevoir les dernières informations sur l’IA

Soyez informé par e-mail lorsque nous publions de nouveaux contenus relatifs à l’IA pour les entreprises.

S’inscrire pour recevoir les dernières informations

Notes de bas de page

¹ Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF, lien externe à ibm.com), Seagate Technology, juillet 2020.
² Data Integrity Trends: Chief Data Ofﬁcer Perspectives in 2021 (lien externe à ibm.com). Corinium, le 18 juin 2021.