Le stockage d’objets est une architecture de stockage de données fiable, efficace et rentable, qui permet de stocker, d’archiver, de sauvegarder et de gérer de grands volumes de données non structurées statiques.
Les données de communication numériques d’aujourd’hui sont en grande partie non structurées, donc inadaptées aux bases de données relationnelles classiques, composées de lignes et de colonnes. Parmi les exemples, citons les e-mails, les vidéos, les photos, les pages Web, les fichiers audio, les données de capteurs, ainsi que d’autres types de fichiers multimédias et des contenu Web (textuels ou non textuels).
Tous ces contenus sont diffusés en continu par les réseaux sociaux, les moteurs de recherche, les téléphones mobiles et les appareils intelligents. Par exemple, les services de streaming comme Netflix s’appuient sur le stockage d’objets pour conserver et diffuser leurs vastes bibliothèques de films et d'émissions auprès des utilisateurs du monde entier, qui y accèdent instantanément, quels que soient leurs appareils et leur emplacement.
Avec une solution de stockage d’objets, vous pouvez stocker et gérer des téraoctets (To) ou des pétaoctets (Po) de données, voire plus, à savoir les déploiements à l’échelle de l’exaoctet qui alimentent les plus grandes plateformes cloud et les applications à forte intensité de données d’aujourd’hui.
Aujourd’hui, stocker et gérer efficacement d’immenses volumes de données sans se ruiner constitue un défi permanent pour les entreprises. Robuste, le stockage d’objets permet de répondre aux besoins actuels en matière de stockage de données, car contrairement au stockage traditionnel par fichiers ou blocs, son évolutivité est quasi illimitée.
Une étude menée par DataIntelo estime le marché mondial du stockage d’objets à environ 6,8 milliards de dollars USD en 2023. Selon cette même étude, il devrait s’élever à près de 25 milliards de dollars d’ici 2032, soit un taux de croissance annuel composé (TCAC) de 15,7 %.1 Cette croissance reflète le besoin toujours plus important de gérer les données non structurées, l’adoption accélérée du cloud et la dépendance croissante à l’égard de l’analytique big data.
Newsletter sectorielle
Restez au fait des tendances les plus étonnantes du secteur dans le domaine de l’IA, de l’automatisation, des données et bien d’autres avec la newsletter Think. Consultez la Déclaration de confidentialité d’IBM.
Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.
Le stockage d’objets a considérablement évolué depuis son apparition au début des années 2000. Parmi les étapes clés, citons le lancement de S3 par Amazon en 2006, qui a établi le standard de facto en matière d’interfaces de programmation d’application (API) pour le stockage d’objets. Étape suivie par l’émergence de solutions open source comme OpenStack Swift en 2010, et l’essor du cloud hybride au milieu des années 2010.
Initialement développé pour des applications Web, le stockage d’objets fait désormais partie intégrante du cloud computing et des environnements conteneurisés. Aujourd’hui, il prend en charge des fonctionnalités avancées telles que la hiérarchisation intelligente des données, les capacités de gestion des versions et l’intégration avec Kubernetes et d’autres plateformes qui automatisent l’orchestration des conteneurs. Parmi les innovations récentes, citons la gestion des données pilotée par l’IA, où les algorithmes de machine learning (ML) permettent d’optimiser le coût et la performance du stockage, et les capacités de stockage d’objets edge, qui rapprochent les données de leur lieu de consommation.
Alors que le stockage d’objets gagnait du terrain dans les environnements cloud natifs, de nombreuses entreprises remettaient en question leur dépendance à l’égard des architectures de stockage traditionnelles.
Jusque-là, les entreprises s’appuyaient sur une option onéreuse, le SAN (storage area network), pour gérer leurs volumes croissants de données, ce qui impliquait des investissements importants en matériel et infrastructure informatique. Au fur et à mesure que les besoins en données augmentaient, cette approche s’avérait de moins en moins viable. Plus flexibles, les services de stockage cloud permettaient aux entreprises d’augmenter ou de réduire la capacité selon leurs besoins.
Au lieu de gérer de grands réseaux de stockage en interne, les entreprises peuvent désormais opter pour le stockage à la demande (STaaS) afin de réduire leurs coûts tout en alliant rapidité et évolutivité. Les principaux fournisseurs de service cloud public, notamment Amazon Web Services (AWS), Google Cloud, IBM® Cloud et Microsoft Azure, proposent des fonctionnalités de stockage d’objets. Cette évolution a permis les approches multicloud hybrides, qui consistent pour les entreprises à allier stratégiquement stockage sur site et fournisseurs de cloud multiples pour optimiser leur performance, réduire leurs coûts et assurer leur conformité.
Le stockage cloud englobe diverses architectures, notamment le stockage de fichiers, le stockage par blocs et le stockage d’objets. Chacune propose son approche en matière de gestion des données et d’accessibilité. Les entreprises modernes utilisent diverses architectures de stockage, selon leurs besoins et leurs types de données.
Alors que les données structurées et les workloads transactionnelles s’appuient généralement sur un stockage traditionnel sous forme de fichiers ou par blocs, l’essor du contenu numérique non structuré a rendu le stockage d’objets essentiel au paysage des données actuel. Comprendre ces trois méthodes de stockage vous aidera à choisir celle qui convient le mieux à vos besoins.
Voici les différences entre stockage d’objets, stockage de fichiers et stockage par blocs.
Avec le stockage de fichiers, les données sont organisées et stockées dans un dossier. Les fichiers sont nommés, étiquetés à l’aide de métadonnées (généralement le nom du fichier, le type de fichier, la date de création et de dernière mise à jour), et organisés dans des dossiers sous une hiérarchie de répertoires et de sous-répertoires.
Voyez le stockage de fichiers comme un archivage de fichiers papier dans un classeur physique. Il y a plusieurs tiroirs (répertoires) et des dossiers de fichiers étiquetés dans chaque tiroir (sous-répertoires).
Pour localiser un dossier particulier dans votre classeur, vous devez ouvrir le tiroir approprié et consulter les étiquettes des dossiers. De même, pour accéder aux données d'un système de stockage de fichiers, votre système informatique n'a besoin que du chemin d'accès (répertoires et sous-répertoires) dans lequel elles se trouvent.
Un tel système de stockage hiérarchique fonctionne bien avec des volumes de données relativement faibles et faciles à organiser. Cependant, à mesure que le nombre de fichiers augmente, le processus de recherche et de récupération peut devenir fastidieux et chronophage.
Le stockage en blocs offre une alternative au stockage basé sur des fichiers avec une efficacité et des performances améliorées. Le stockage en blocs décompose un fichier en blocs de données de taille égale et stocke ces blocs de données séparément sous une adresse unique. Vous n'avez pas besoin d'une structure de dossiers-fichiers. En revanche, vous pouvez stocker la collection de blocs n'importe où dans le système pour une efficacité maximale.
Pour accéder à un fichier, le système d'exploitation d'un serveur utilise l'adresse unique pour rassembler les blocs dans le fichier. Vous gagnerez en efficacité car le système n'a pas besoin de parcourir les répertoires et les hiérarchies de fichiers pour accéder aux blocs de données. Le stockage en blocs fonctionne bien pour les applications métier critiques, les bases de données transactionnelles et les machines virtuelles qui nécessitent une faible latence, un accès granulaire ou plus détaillé aux données et des performances élevées et constantes.
Au lieu de diviser les fichiers en blocs ou de les organiser en dossiers hiérarchiques, le stockage d’objets traite chaque donnée comme une unité discrète et facile à gérer. Contrairement aux systèmes de fichiers, qui reposent sur des structures de répertoire, et au stockage par blocs, qui fragmente les données, le stockage d’objets préserve l’intégrité des données dans chaque unité de stockage.
Le stockage d’objets est une option rentable et extrêmement évolutive pour vos données non structurées, qui dépasse largement les limites effectives des solutions de stockage par blocs et fichiers. Il est parfait pour archiver des données statiques telles que les dossiers de conformité, les bibliothèques multimédias et les données de sauvegarde qui n’ont pas besoin d’être souvent modifiées.
Les objets sont des unités de données discrètes, stockées dans un environnement de données structurellement plat, typique des systèmes de stockage d’objets. Contrairement aux systèmes de fichiers traditionnels, il n’y a pas de véritables dossiers, annuaires ni de hiérarchies complexes, même si les structures de type dossier peuvent être simulées grâce aux conventions de nommage.
Chaque objet est une unité autonome qui comprend les données, les métadonnées associées (informations descriptives sur l’objet) et un identifiant unique, souvent appelé « clé d’objet ». Cet identifiant unique distingue l’objet au sein du système de stockage et peut ressembler à un chemin d’accès à un fichier, alors qu’il ne représente pas une structure de répertoire à proprement parler.
Ces informations permettent à une application de localiser et d'accéder à l'objet. Vous pouvez regrouper des unités de stockage d'objets dans des pools de stockage plus grands et distribuer ces pools sur plusieurs sites. Cette fonctionnalité permet une évolutivité illimitée et de meilleures résilience des données et reprise après sinistre.
Le stockage d’objets élimine la complexité et les problèmes d’évolutivité liés aux systèmes de fichiers hiérarchiques. Les objets peuvent être stockés localement (centres de données sur site, serveurs cloud ou environnements hybrides et multicloud), et sont accessibles partout dans le monde. Les déploiements modernes associent souvent orchestration des conteneurs et infrastructure distribuée pour gérer les systèmes sous-jacents aux solutions de stockage d’objets.
Les objets (chacun composé de données, de métadonnées et d’un identifiant unique) sont accessibles au sein d’un système de stockage d’objets grâce aux API. L’API native du stockage d’objets est généralement une API RESTful basée sur HTTP (également appelée « service Web RESTful »). La plupart des fournisseurs proposent également des kits de développement logiciel (SDK) qui simplifient l’interaction avec ces API dans différents langages de programmation.
Ces API utilisent l’identifiant (ou clé) unique de l’objet pour le récupérer et permettent également d’interroger ses métadonnées. Comme les API sont basées sur Internet, les objets sont accessibles partout, sur tout appareil disposant d’une connectivité réseau.
Les API RESTful utilisent des commandes HTTP comme « PUT » ou « POST » pour télécharger l’objet, « GET » pour le récupérer et « DELETE » pour le supprimer. (HTTP, sigle de « Hypertext Transfer Protocol » est l’ensemble de règles que l’on applique au transfert de textes, d’images, de son, de vidéo et d’autres fichiers multimédias sur Internet.)
Vous pouvez stocker autant de fichiers statiques que vous le souhaitez sur une instance de stockage d'objets à appeler par une API. De nouvelles normes API RESTful émergent et vont au-delà de la création, de la récupération, de la mise à jour et de la suppression d'objets. Elles permettent aux applications de gérer le stockage d'objets, ses conteneurs, ses comptes, sa multi-location, sa sécurité, sa facturation, etc.
Supposons par exemple que vous souhaitiez stocker tous les livres d'un grand système de bibliothèque sur une seule plateforme. Vous devrez stocker le contenu des livres (données), mais également les informations associées telles que l'auteur, la date de publication, l'éditeur, le sujet, les droits d'auteur et d'autres détails. Vous pouvez stocker toutes ces données et métadonnées dans une base de données relationnelle, organisée dans des dossiers sous une hiérarchie de répertoires et de sous-répertoires.
Mais face à des millions de livres, le processus de recherche et de récupération devient fastidieux et chronophage. Un système de stockage d’objets conviendra car les données sont statiques ou fixes. Dans cet exemple, le contenu du livre ne changera pas.
Les objets sont stockés en tant que « packages » dans une structure à plat et facilement localisés et récupérés avec un seul appel API. De plus, à mesure que le nombre de livres continue d'augmenter, vous pouvez agréger des unités de stockage dans de plus grands pools de stockage et distribuer ces pools pour une évolutivité illimitée.
Vous pouvez utiliser de simples appels d’API pour télécharger et récupérer les fichiers dans un système de stockage d’objets, mais une application a également besoin des métadonnées de l’objet pour localiser l’objet dans le stockage. C’est là que la base de données de stockage d’objets entre en jeu. Elle fournit un annuaire qui s’appuie sur les métadonnées de l’objet pour localiser les fichiers de données correspondants dans un système de stockage distribué.
Chaque groupe de stockage d’objets possède une base de données de stockage d’objets qui contient deux tables :
La table du répertoire d’objets contient des informations descriptives concernant chaque objet (les métadonnées). Ce répertoire conserve le suivi de tous les objets dans la hiérarchie de stockage en enregistrant l'identifiant du nom de la collection, le nom de l'objet et d'autres informations pertinentes. Par exemple, dans la méthodologie de stockage d'objets courante, la table du répertoire d'objets comprend trois index :
La table de stockage d’objets contient les données ou le fichier même (les objets). Les données (contenus numériques fixes tels que les fichiers vidéo et image ou les bibliothèques volumineuses de documents) sont stockées dans le magasin d’objets. Parallèlement, les métadonnées (informations contextuelles sur les données, notamment l’ID du nom) sont stockées dans une base de données ou dans une table d’annuaire d’objets.
Lorsqu'une application « publie » un fichier, elle crée les métadonnées et les stocke dans la table du répertoire d'objets de la base de données de stockage d'objets, tout en « plaçant » le fichier dans la table de stockage d'objets. Pour récupérer le fichier ultérieurement, l'application interroge le répertoire/la base de données de l'objet pour accéder aux métadonnées et utilise ces informations descriptives et d'identification pour localiser ou « obtenir » les données.
Les technologies open source associent flexibilité et contrôle sur les options de gestion et de stockage des données. Elles peuvent être utilisées comme alternatives, ou être intégrées aux solutions propriétaires proposées par les fournisseurs de services cloud ou autres.
Grâce aux outils open source et à l’accès aux API ouvertes, vous pouvez personnaliser le code pour l’adapter aux besoins spécifiques de votre entreprise, tout en conservant sa compatibilité avec les systèmes propriétaires existants. Cette approche vous offre la liberté d’utiliser votre propre matériel, ou de combiner le matériel provenant de différents fournisseurs, tout en bénéficiant des contributions de la communauté de développeurs.
Les principales solutions de stockage d’objets open source respectent le protocole de stockage d’objets Simple Storage Service (Amazon S3) d’Amazon. Lancé en 2006, ce dernier est désormais le standard de facto en matière d’API de stockage cloud.
Les solutions open source les plus utilisées sont Ceph, MinIO et OpenStack Swift. Si ces solutions proposent différentes fonctionnalités, options en matière de politiques et méthodes, elles servent toutes le même objectif : permettre le stockage à grande échelle de données numériques non structurées, avec des API RESTful compatibles S3.
Beaucoup proposent également leur propre API comme alternative à S3. OpenStack Swift, par exemple, prend en charge l’API S3 d’Amazon, mais propose également sa propre API Swift, dotée de fonctionnalités uniques. Ceph Object Storage est compatible avec S3, mais prend également en charge un large sous-ensemble de l’API OpenStack Swift, ce qui garantit une interaction flexible des applications avec le système de stockage.
Le stockage d’objets facilite la sauvegarde et la reprise après sinistre, puisqu’il constitue une alternative plus efficace aux solutions de sauvegarde physiques. Par exemple, les solutions de sauvegarde physique telles que les bandes et les disques durs exigent que les données soient physiquement chargées, retirées et transportées hors site pour assurer la redondance géographique.
Vous pouvez utiliser le stockage d'objets pour sauvegarder automatiquement les bases de données sur site dans le cloud et pour répliquer les données de manière rentable entre les centres de données réparties. Ajoutez une sauvegarde supplémentaire hors site et même dans toutes les régions géographiques pour assurer la reprise après sinistre.
Le stockage d’objets cloud facilite la conservation des données à long terme. Il remplace les méthodes traditionnelles telles que le stockage en réseau (NAS) et permet de réduire les coûts d’infrastructure informatique. Il constitue également une solution économique pour conserver les grands volumes de contenu multimédia riche, comme les images et les vidéos, que l’on ne consulte que très rarement.
Évolutif et rentable, le stockage d’objets permet de créer des data lakes centralisés. Ces data lakes peuvent stocker des quantités illimitées de données structurées et non structurées provenant de diverses sources. Les données stockées peuvent ensuite être interrogées pour analyser les big data et générer des informations sur les clients, les opérations de l’entreprise et les tendances du marché.
Le stockage d’objets cloud sert de magasin de données persistant pour le développement d’applications cloud. Il permet de créer de nouvelles applications cloud natives et de moderniser les applications héritées. Grâce au stockage d’objets, vous pouvez gérer efficacement de grands volumes de données non structurées, IdO et mobiles, et simplifier la mise à jour des composants de vos applications.
Compatible avec les grands jeux de données, le stockage d’objets facilite l’entraînement de l’IA générative et la production de contenus. En outre, il s’adapte pour traiter d’immenses quantités de données, qu’il permet d’organiser et de suivre grâce aux métadonnées, afin d’accélérer les workflows et l’accès aux données lors de l’ inférence.
Les entreprises utilisent le stockage d’objets pour gérer de grands volumes de documents, de fichiers multimédias et d’autres types de contenus agrémentés de métadonnées riches pour faciliter l’organisation et la récupération.
Les appareils IdO génèrent de grandes quantités de données à partir de capteurs que les solutions de stockage d’objets collectent, stockent et mettent à disposition à des fins d’analyse. Cela inclut également les scénarios d’edge computing, où le traitement de données intervient plus près de la source.
Stockez des données dans n’importe quel format, n’importe où, avec évolutivité, résilience et sécurité.
Accédez à des services de stockage cloud pour des solutions de stockage de données évolutives, sécurisées et rentables.
Déverrouillez de nouvelles fonctionnalités et stimulez l’agilité de votre entreprise grâce aux services de conseil d’IBM Cloud.
1. Object Storage Market, Global Forecast From 2025, DataIntelo, 2025