Qu’est-ce que l’OLAP ?

L’OLAP, ou traitement analytique en ligne, est une technologie qui permet d’effectuer à grande vitesse des requêtes complexes ou des analyses multidimensionnelles sur de grands volumes de données dans un entrepôt de données, un data lake ou un autre référentiel de données. L’OLAP est utilisé dans la business intelligence (BI), l’aide à la décision et dans diverses applications de prévision et de production de rapports d’entreprise.

La plupart des données d’entreprise ont plusieurs dimensions, c’est-à-dire plusieurs catégories dans lesquelles elles sont décomposées à des fins de présentation, de suivi ou d’analyse. Par exemple, les chiffres de vente peuvent avoir plusieurs dimensions liées au lieu (région, pays, état/province, magasin), à la période (année, mois, semaine, jour), au produit (vêtements, hommes/femmes/enfants, marque, type, et plus encore.

Mais dans un entrepôt de données ou un data lake, les ensembles de données sont stockés dans des tables, chacune d’entre elles pouvant organiser les données selon seulement deux de ces dimensions à la fois. L’OLAP extrait les données de plusieurs ensembles de données relationnelles et les réorganise dans un format multidimensionnel qui permet un traitement très rapide et une analyse génératrice d’informations.

Apprendre à utiliser Presto

Découvrez l'e-book gratuit d'O'Reilly pour apprendre à vous lancer avec Presto, le moteur SQL open source destiné à l'analyse des données.

Contenu connexe

Obtenir le rapport d'IDC

Qu’est-ce qu’un cube OLAP ?

Élément central de la plupart des systèmes OLAP, le cube OLAP est une base de données multidimensionnelle organisée en tables qui permet de traiter et d’analyser plusieurs dimensions de données beaucoup plus rapidement et efficacement qu’une base de données relationnelle.

Une table de base de données relationnelle est structurée comme une feuille de calcul et stocke des enregistrements individuels dans un format bidimensionnel (ligne et colonne). Chaque « fait » de donnée de la base de données se trouve à l’intersection de deux dimensions (une ligne et une colonne), qui peuvent être par exemple la région et les ventes totales.

Les outils de reporting SQL et de base de données relationnelle peuvent certes interroger, rapporter et analyser des données multidimensionnelles stockées dans des tables, mais les performances ralentissent à mesure que les volumes de données augmentent. Et il faut beaucoup de travail pour réorganiser les résultats de manière à se focaliser sur différentes dimensions.

C’est là qu’intervient le cube OLAP. Le cube OLAP étend la table avec des couches supplémentaires, chacune ajoutant des dimensions supplémentaires, généralement le niveau suivant dans la « hiérarchie conceptuelle » de la dimension. Par exemple, la couche supérieure du cube peut organiser les ventes par région, et les couches supplémentaires peuvent être le pays, l’État/la province, la ville et même un magasin spécifique.

En théorie, un cube peut contenir un nombre infini de couches. (Un cube OLAP représentant plus de trois dimensions est parfois appelé un hypercube.) Des cubes plus petits peuvent également exister au sein des couches : par exemple, chaque couche de magasin peut contenir des cubes organisant les ventes par vendeur et par produit. En pratique, les analystes de données créeront des cubes OLAP contenant uniquement les couches dont ils ont besoin, pour une analyse et des performances optimales.

Drill-down

L’opération drill-down permet de convertir les données moins détaillées en données plus détaillées par l’une des deux méthodes suivantes : descendre dans la hiérarchie conceptuelle ou ajouter une nouvelle dimension au cube. Par exemple, si vous affichez les données de vente pour le calendrier civil ou le trimestre fiscal d’une organisation, vous pouvez effectuer un drill-down pour voir les ventes de chaque mois, en descendant dans la hiérarchie conceptuelle de la dimension « temps ».

Roll up

Le roll up est le contraire du drill-down : il agrège les données d’un cube OLAP en remontant dans la hiérarchie conceptuelle ou en réduisant le nombre de dimensions. Par exemple, vous pouvez monter dans la hiérarchie conceptuelle de la dimension « emplacement » en affichant les données de chaque pays plutôt que de chaque ville.

Slice and dice

L’opération « slice » crée un sous-cube en sélectionnant une seule dimension dans le cube OLAP principal. Par exemple, vous pouvez effectuer un slice en mettant en évidence toutes les données du premier trimestre fiscal ou civil de l’organisation (dimension temporelle).

L’opération « slice » crée un sous-cube en sélectionnant plusieurs dimensions dans le cube OLAP principal. Par exemple, vous pouvez effectuer une opération « dice » en mettant en évidence toutes les données par calendrier ou trimestre fiscal d’une organisation (dimension temporelle) et aux États-Unis et au Canada (dimension géographique).

Pivot

La fonction « pivot » fait pivoter la vue cubique actuelle pour afficher une nouvelle représentation des données, permettant ainsi des vues multidimensionnelles dynamiques des données. La fonction « pivot » de l’OLAP est comparable à la fonctionnalité « tableau croisé dynamique » de tableurs tels que Microsoft Excel, mais si les tableaux croisés dynamiques d’Excel peuvent présenter des difficultés, les pivots OLAP sont relativement simples à utiliser (moins d’expertise est requise) et offrent un temps de réponse et des performances de requête plus rapides.

MOLAP, ROLAP et HOLAP

L’OLAP qui fonctionne directement avec un cube OLAP multidimensionnel est appelé OLAP multidimensionnelou MOLAP. Encore une fois, pour la plupart des utilisations, le MOLAP est le type d’analyse de données multidimensionnelles le plus rapide et le plus pratique.

Cependant, il existe deux autres types d’OLAP qui peuvent être préférables dans certains cas :

ROLAP

Le ROLAP, ou OLAP relationnel, est une analyse de données multidimensionnelles qui opère directement sur les données des tables relationnelles, sans réorganiser au préalable les données dans un cube.

Comme indiqué précédemment, le SQL est un outil parfaitement adapté aux requêtes, aux rapports et aux analyses multidimensionnelles. Mais les requêtes SQL requises sont complexes, les performances peuvent ralentir et la vue des données qui en résulte est statique (il est impossible de la faire pivoter pour représenter une vue différente des données). Le ROLAP est particulièrement utile lorsque la capacité à travailler directement avec de grandes quantités de données est plus importante que les performances et la flexibilité.

HOLAP

Le HOLAP, ou OLAP hybride, tente de créer une division optimale du travail entre les bases de données relationnelles et multidimensionnelles au sein d’une architecture OLAP unique. Les tables relationnelles contiennent de plus grandes quantités de données, et les cubes OLAP sont utilisés pour les agrégations et le traitement spéculatif. Le HOLAP nécessite un serveur OLAP qui prend en charge à la fois le MOLAP et le ROLAP.

Un outil HOLAP peut effectuer un « drill through » jusqu’aux tables relationnelles, ce qui ouvre la voie à un traitement rapide des données et à un accès flexible. Ce système hybride peut offrir une meilleure évolutivité mais ne peut échapper à l’inévitable ralentissement lors de l’accès à des sources de données relationnelles. En outre, son architecture complexe nécessite généralement des mises à jour et une maintenance plus fréquentes, car elle doit stocker et traiter toutes les données provenant de bases de données relationnelles et de bases de données multidimensionnelles. Pour cette raison, le HOLAP peut être plus cher.

OLAP et OLTP

Le traitement des transactions en ligne, ou OLTP, fait référence aux méthodes de traitement des données et aux logiciels axés sur les données et les applications orientées transactions.

La principale différence entre l’OLAP et l’OLTP réside dans le nom : l’OLAP est de nature analytique et l’OLTP est transactionnel.

Les outils OLAP sont conçus pour l’analyse multidimensionnelle des données dans un entrepôt de données, qui contient à la fois des données transactionnelles et historiques. En fait, un serveur OLAP est généralement le niveau d’analyse intermédiaire d’une solution d’entreposage de données. Les utilisations courantes de l’OLAP comprennent l’exploration de données et d’autres applications de business intelligence, les calculs analytiques complexes et les scénarios prédictifs, ainsi que les fonctions de production de rapports d’entreprise comme l’analyse financière, la budgétisation et la planification prévisionnelle.

L’OLTP est conçu pour prendre en charge les applications orientées transactions en traitant les transactions récentes aussi rapidement et précisément que possible. Les utilisations courantes de l’OLTP incluent les guichets automatiques, les logiciels de commerce électronique, le traitement des paiements par carte de crédit, les réservations en ligne, les systèmes de réservation et les outils de tenue de dossiers.

Pour en savoir plus sur les différences entre ces approches, consultez l’article « OLAP et OLTP : quelle est la différence ?

OLAP et architecture cloud

L’OLAP permet aux entreprises de maximiser le potentiel de leurs données en les convertissant dans le format le plus pratique pour l’analyse multidimensionnelle. Cela permet de dégager plus facilement des informations utiles pour l’entreprise. Cependant, si ces systèmes sont conservés en interne, cela limite le potentiel de montée en charge.

Les services OLAP dans le cloud sont moins coûteux et plus faciles à configurer, ce qui les rend plus attrayants pour les petites entreprises ou les startups à petit budget. Les entreprises peuvent exploiter le vaste potentiel des entrepôts de données dans le cloud, qui effectuent des analyses sophistiquées à des vitesses inégalées grâce au traitement massivement parallèle (MPP). Les entreprises peuvent donc utiliser l’OLAP à la vitesse et à l’échelle du cloud, en analysant de grandes quantités de données sans les déplacer de leur entrepôt de données dans le cloud.

Constance Hotels, Resorts & Golf est un groupe hôtelier de luxe avec neuf propriétés sur les îles de l’Océan indien. Malheureusement, le manque de communication d’île à île a provoqué un cloisonnement organisationnel, avec des données métier isolées dans chaque complexe hôtelier. L’entreprise a mis en place un entrepôt de données cloud et une architecture d’analyse pour relier tous les systèmes et les outils sur site à un référentiel de données central dans le cloud. Ce faisant, l’entreprise a obtenu les informations dont elle avait besoin (à l’échelle du groupe) pour tirer parti d’analyses prédictives avancées et implémenter un système OLAP.

Dans l’architecture cloud, l’OLAP est une solution rapide et rentable conçue pour l’avenir. Une fois les cubes créés, les équipes peuvent utiliser les outils de business intelligence existants pour se connecter instantanément au modèle OLAP et tirer des informations interactives en temps réel de leurs données cloud.

Solutions connexes

IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud est un service de cloud public géré. Vous pouvez configurer IBM Db2 Warehouse sur site avec votre propre matériel ou dans un cloud privé.

Découvrir IBM Db2 Warehouse on Cloud

Services de création de cubes

IBM DB2 Warehouse intègre et simplifie l’environnement de l’entrepôt de données en permettant une création d’entrepôts dynamique et en fournissant une prise en charge directe de l’OLAP dans le cadre de l’entrepôt de données.

Découvrir les services de création de cubes

Ressources

Comment choisir le bon entrepôt de données pour l’IA

Accélérez l’innovation et obtenez des résultats métier en transformant les données en informations.

OLAP et OLTP : quelle est la différence ?

Ces termes sont souvent confondus. Quelles sont leurs principales différences et comment choisir la bonne technologie par rapport à vos besoins ?

Passez à l’étape suivante

Faites évoluer les workloads d’IA pour toutes vos données n’importe où avec IBM watsonx.data, un entrepôt de données adapté à vos besoins basé sur une architecture data lakehouse ouverte.

Découvrir watsonx.data

Réserver une démo en direct