Qu'est-ce que le stockage de données ?

Vue plongeante sur un groupe d’élèves utilisant un équipement électrique posé sur une table dans une salle de classe

Auteurs

Stephanie Susnjara

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

Qu'est-ce que le stockage de données ?

Le stockage des données fait référence aux supports magnétiques, optiques ou mécaniques qui enregistrent et conservent des informations numériques pour des opérations en cours ou futures.

Il existe deux types d’informations numériques : les données d’entrée et les données de sortie. Les utilisateurs fournissent les données d’entrée, et les ordinateurs fournissent les données de sortie. Le processeur d’un ordinateur ne peut toutefois rien calculer ni produire de données de sortie sans l’entrée de l’utilisateur. 

Les utilisateurs peuvent saisir les données d’entrée directement sur ordinateur. Cependant, dès le début de l’ère informatique, ils ont pu constater que saisir manuellement les données demandait trop de temps et d’énergie. L’une des solutions à court terme est la mémoire de l’ordinateur, également connue sous le nom de mémoire vive (RAM). Sa capacité de stockage et de rétention est toutefois limitée. Comme son nom l’indique, la mémoire en lecture seule (ROM) permet de lire les données, mais pas nécessairement de les modifier. Elle contrôle les fonctions de base de l’ordinateur. 

Si les sciences informatiques ont connu des progrès significatifs en matière de mémoire avec le développement de la RAM dynamique (DRAM) et de la DRAM synchrone (SDRAM), le coût, l’espace et la capacité de rétention demeurent problématiques. Lorsqu’un ordinateur est mis hors tension, les données stockées par la RAM s’effacent. La solution ? Le stockage de données.

L’espace de stockage permet aux utilisateurs d’enregistrer les données sur un appareil. Si l’ordinateur est mis hors tension, les données sont conservées. Au lieu de saisir les données manuellement, les utilisateurs peuvent demander à l’ordinateur de les extraire à partir des périphériques de stockage. Les ordinateurs peuvent lire les données d’entrée provenant de diverses sources, selon les besoins, puis créer et enregistrer la sortie dans ces mêmes sources ou dans d’autres emplacements de stockage. Les utilisateurs peuvent également partager leur espace de stockage des données avec d’autres personnes. 

Aujourd’hui, les entreprises et les utilisateurs ont besoin d’une solution de stockage des données adaptée aux besoins de calcul importants de l’analyse des big data, de l’intelligence artificielle (IA), du machine learning (ML) et de l’Internet des objets (IdO). Lorsque l’on stocke d’immenses quantités de données, il est impératif d’empêcher toute perte en cas de sinistre, de défaillance ou de fraude. Pour prévenir les pertes de données, les entreprises peuvent donc également utiliser le stockage de données comme solution de sauvegarde et de restauration.

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA 


La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets. 

Comment fonctionne le stockage de données ?

Pour faire simple, disons que les ordinateurs ou les terminaux modernes se connectent aux périphériques de stockage soit directement, soit par le biais d’un réseau. Les utilisateurs demandent aux ordinateurs d’accéder aux données à partir de ces périphériques de stockage et de les stocker là-dessus. Le stockage de données repose toutefois sur deux éléments : la forme sous laquelle les données sont prises, et les périphériques sur lesquels elles sont enregistrées et stockées.

IBM Storage FlashSystem

IBM Storage FlashSystem : optimiser VMware pour le coût, la simplicité et la résilience

Découvrez comment IBM FlashSystem optimise les environnements VMware en termes de rentabilité, de simplicité et de résilience. Cette session met en évidence la façon dont FlashSystem peut améliorer la sécurité, l’accessibilité et la performance des données, ce qui en fait une solution idéale pour les infrastructures informatiques modernes.

Dispositifs de stockage des données

Les utilisateurs ont besoin de dispositifs pour stocker les données, quelle que soit leur forme. Il existe deux grandes catégories de dispositifs de stockage des données : le stockage direct et le stockage réseau.

Le stockage direct, également connu sous le nom de stockage à connexion directe (DAS), porte bien son nom. En effet, il se trouve généralement à proximité et est directement connecté à la machine informatique qui y accède. Souvent, une seule machine y est connectée. Le DAS peut également fournir des services de sauvegarde locale corrects, mais le partage est limité. Parmi les périphériques DAS, citons les disquettes, les disques optiques, à savoir les disques compacts (CD) et les disques vidéo numériques (DVD), les disques durs (HDD), les clés USB et les disques SSD (solid state drive).

Le stockage en réseau permet à plusieurs ordinateurs d’y accéder via un réseau, synonyme d’efficacité accrue pour le partage de données et la collaboration. Sa capacité de stockage hors site en fait une option mieux adaptée aux sauvegardes et à la protection des données. Les deux configurations typiques du stockage basé sur un réseau sont le stockage en réseau (NAS) et storage area network (SAN).

Un NAS est généralement un périphérique unique, composé de conteneurs de stockage redondants ou d’une baie redondante de disques indépendants (RAID). Le stockage SAN peut être un réseau comportant différents types de périphériques (SSD flash, stockage hybride, stockage cloud hybride, stockage cloud, logiciels et appliances de sauvegarde).

NAS et SAN : quelle différence ?

Voici les différences entre le NAS et le SAN :

NAS

  • Périphérique de stockage unique ou RAID
  • Système file storage
  • Réseau Ethernet TCP/IP
  • Utilisateurs limités
  • Vitesse limitée
  • Options d’extension limitées
  • Faible coût et installation facile

SAN

  • Réseau de plusieurs appareils
  • Système de stockage en mode bloc
  • Réseau Fibre Channel
  • Optimisé pour plusieurs utilisateurs
  • Performances accélérées
  • Haute évolutivité
  • Coût plus élevé et configuration complexe

Types de périphériques et de systèmes de stockage

SSD et stockage flash

Le stockage flash est une technologie de solid state drive qui utilise des puces de mémoire flash pour écrire et stocker les données. Les disques SSD flash stockent les données à l’aide d’une mémoire flash. Contrairement aux disques durs (HDD), les systèmes SSD ne comportent aucune pièce mobile et présentent une latence, moins importante, ce qui explique qu’il y en ait moins. La plupart des SSD modernes ayant une mémoire flash, le stockage flash est synonyme de système solide-state.

Stockage hybride

Le stockage SSD et flash offre un débit plus élevé que les disques durs, mais les baies 100 % flash peuvent s’avérer plus chères. Bon nombre d’entreprises adoptent une approche hybride, qui consiste à allier la vitesse de la mémoire flash à la capacité de stockage des disques durs. Une infrastructure de stockage équilibrée permet d’adopter la technologie la plus adaptée à chaque besoin. Économique, le stockage hybride est une bonne option si l’on souhaite renoncer aux disques durs traditionnels sans passer au 100 % flash.

Stockage dans le cloud

Le stockage cloud est une alternative économique et évolutive aux disques durs et aux réseaux de stockage sur site. Les fournisseurs de service cloud (CSP) comme Google Cloud, Microsoft Azure, IBM Cloud ou encore Amazon Web Services (AWS), vous permettent d’enregistrer vos données et vos fichiers dans un emplacement hors site, auquel vous accédez par le biais de l’Internet public ou d’une connexion réseau dédié. Le fournisseur héberge, sécurise, gère et entretient les serveurs, ainsi que l’infrastructure associée, et veille à ce que vous puissiez accéder aux données à tout moment.

stockage dans le cloud hybride

Le stockage dans le cloud hybride combine des éléments des clouds public et privé. Les entreprises peuvent choisir dans quel cloud stocker leurs données. Par exemple, pour les données dont le traitement est hautement réglementé, qui sont soumises à des exigences strictes d’archivage et de réplication, un environnement de cloud privé sera plus adapté, tandis que les données moins sensibles peuvent être stockées dans le cloud public. Certaines entreprises optent pour les clouds hybrides pour compléter leurs réseaux de stockage internes par un stockage dans le cloud public.

Logiciels et appareils de sauvegarde du stockage

Le stockage et les appliances de sauvegarde protègent les données en cas d’incident, de défaillance ou de fraude. Ils effectuent régulièrement des copies des données et des applications sur un appareil secondaire distinct, puis utilisent ces copies pour assurer la reprise après incident. Parmi les appareils de sauvegarde, citons les disques durs , les SSD, les lecteurs de bande ou encore les serveurs.

Les fournisseurs de services cloud (CSP) proposent également un service de stockage des sauvegardes à la demande appelé sauvegarde à la demande (BaaS). Comme la plupart des solutions à la demande, le BaaS constitue une option peu coûteuse et évolutive pour enregistrer les données dans un emplacement distant afin de les protéger.

Formes de stockage des données

Les données peuvent être enregistrées et stockées sous trois formes principales : file storage, stockage en bloc et object storage. 

Pour en savoir plus sur ces types de stockage des données, consultez l’article « Stockage d’objets, stockage de fichiers et stockage de blocs : quelle est la différence ? », et regardez la vidéo suivante.

Stockage de fichiers

Le file storage, ou stockage de fichiers, est une méthode de stockage hiérarchique utilisée pour organiser et stocker des données. En d’autres termes, les données sont stockées dans des fichiers, qui sont organisés dans des dossiers, qui sont regroupés au sein d’une hiérarchie de répertoires et de sous-répertoires.

Stockage en blocs

Le stockage en bloc est une technologie qui permet de stocker les données en blocs. Ces derniers sont ensuite stockés séparément, chacun étant doté d’un identifiant unique. Les développeurs privilégient le stockage en bloc pour assurer un transfert de données rapide, efficace et fiable.

Object Storage

L’object storage, ou stockage d’objets, est une architecture de stockage des données qui permet de gérer de grandes quantités de données non structurées. Ces données sont difficiles à organiser, ou ne répondent pas aux exigences des bases de données relationnelles traditionnelles, composées de lignes et de colonnes. Parmi les exemples, citons les e-mails, les vidéos, les photos, les pages Web, les fichiers audio, les données de capteurs, ainsi que d’autres contenus multimédias et Web (textuels ou non textuels). Parmi les autres cas d’utilisation, citons la création d'applications cloud natives ou encore la transformation des applications héritées en applications cloud nouvelle génération. Pour ce faire, on utilise le stockage d’objets cloud comme magasin de données permanent.

Storage area network et stockage de données pour les entreprises

La mémoire des ordinateurs et le stockage local ne répondent pas toujours aux besoins en matière de stockage, de protection, d’accès, de vitesse et de performance. C’est pourquoi la plupart des entreprises se tournent vers le storage area network (SAN), en plus de leur système de stockage en réseau (NAS), pour répondre aux exigences de leurs applications.

Parfois appelé « le réseau derrière les serveurs », un storage area network (SAN) est un réseau spécialisé à haut débit qui relie serveurs et périphériques de stockage. Il s’agit d’une infrastructure de communication qui assure des connexions physiques en permettant aux dispositifs « point-à-point » de créer un pont sur le réseau, grâce à des éléments interconnectés comme les commutateurs et les directeurs.

Le SAN peut également être considéré comme une extension du bus de stockage. Avec ce dernier, les périphériques de stockage et les serveurs se connectent entre eux par le biais d’éléments similaires, comme les réseaux locaux (LAN) et les réseaux étendus (WAN). Le SAN comprend également une couche de gestion qui organise les connexions, les éléments de stockage et les systèmes informatiques. Cette couche garantit un transfert de données sécurisé et efficace.

Auparavant, le nombre de périphériques de stockage pouvant être connectés à un serveur était limité. Le SAN permet une mise en réseau flexible, grâce à laquelle un ou plusieurs serveurs hétérogènes répartis sur plusieurs centres de données partagent le même utilitaire de stockage. Avec le SAN, plus besoin de la connexion dédiée traditionnelle entre un serveur et un système de stockage. Ce n’est plus non plus le serveur qui possède et gère les périphériques de stockage. Un réseau peut désormais inclure de nombreux périphériques de stockage tels que les disques, les bandes magnétiques et les supports de stockage optique, et l’utilitaire de stockage peut être situé à distance des serveurs qu’il utilise.

Composants du SAN

L’infrastructure de stockage est la base sur laquelle repose l’information. Elle doit donc soutenir les objectifs et le modèle économique de l’entreprise. Les infrastructures SAN améliorent la disponibilité des réseaux, ainsi que l’accessibilité des données, et facilite la gestion des systèmes. Dans cet environnement, déployer des périphériques de stockage plus nombreux et plus rapides ne suffit pas. Pour être efficace, le SAN doit bénéficier d’une bonne conception.

Fibre Channel

Le premier élément à prendre en compte pour mettre en œuvre un SAN est la connectivité des composants de stockage et de serveur, qui s’appuient généralement sur Fibre Channel, une technologie de transfert des données à haut débit. Le SAN, comme le LANS, interconnecte les interfaces de stockage dans diverses configurations réseau et sur de plus longues distances.

Infrastructure de serveur

L’infrastructure serveur, qui combine plusieurs plateformes de serveur, est la principale raison pour laquelle on se tourne vers les solutions SAN. Des projets tels que la consolidation des serveurs et l’e-commerce rendent le SAN incontournable, et le stockage réseau plus critique.

Système de stockage

Un système de stockage peut être constitué de systèmes sur disques et de systèmes sur bande. Les systèmes sur disques peuvent comprendre des disques durs, des disques SSD ou des disques Flash. Les systèmes sur bande peuvent être constitués de lecteurs de bande, de chargeurs automatiques de bande et de bibliothèques de bandes.

Système réseau

La connectivité SAN comporte des composants matériels et logiciels qui interconnectent périphériques de stockage et serveurs. Parmi les composants matériels, citons les concentrateurs, les commutateurs, les directeurs et les routeurs.

Stockage défini par logiciel (SDS) et technologies associées

Aujourd’hui, le stockage de données évolue vers une approche logicielle qui s’articule autour du stockage défini par logiciel (SDS) et des technologies associées, qui assurent une gestion des données plus agile et plus efficace. Selon un rapport publié par Technavio, le marché mondial du stockage défini par logiciel (SDS) devrait augmenter de 105,07 milliards de dollars américains entre 2024 et 2029.1

Stockage défini par logiciel (Software-defined storage, SDS)

Avec le stockage défini par logiciel (SDS), une couche logicielle découple les ressources de stockage de l’infrastructure matérielle sous-jacente. Le SDS s’appuie sur la virtualisation pour créer un pool unifié de ressources de stockage qui peuvent être allouées de façon dynamique, soit par l’automatisation, soit manuellement grâce à un tableau de bord API.

Contrairement aux systèmes NAS et SAN traditionnels, le SDS offre la flexibilité nécessaire au processus complexe de transformation numérique. Par exemple, le SDS peut considérablement rationaliser les tâches de gestion du stockage en automatisant les workloads liées au provisionnement, à la surveillance et au dépannage.

Virtualisation du stockage

La virtualisation du stockage consiste à regrouper des ressources de stockage physiques provenant de plusieurs systèmes de stockage pour que le stockage semble être réalisé intégralement sur un seul et même appareil. Le SDS, quant à lui, sépare les services de stockage de l’appareil. Les utilisateurs gèrent la virtualisation du stockage sur une console afin d’assurer la sécurité, la fiabilité et l’efficacité de leurs données et ressources de stockage dans les environnements de serveurs et de bureaux virtualisés.

Stockage hyperconvergé

Le stockage hyperconvergé est une architecture de stockage des données qui regroupe les ressources SDS pour être gérées au sein d’une infrastructure hyperconvergée (HCI).

Le stockage hyperconvergé intègre dans la pile HCI stockage, fonctions de calcul et mise en réseau. Grâce à la virtualisation, l’infrastructure hyperconvergée sépare les ressources de stockage des composants matériels. C’est pourquoi le stockage hyperconvergé est beaucoup plus flexible et évolutif que les solutions de stockage traditionnelles.

Sécurité du stockage de données

Les solutions de sécurité du stockage de données protègent les données sur site, ainsi que dans les environnements cloud, contre les violations de données, les cyberattaques et autres menaces.

Les violations de données sont coûteuses et constituent un défi permanent pour les entreprises. Selon le Rapport sur le coût d’une violation de données publié en 2023 par IBM, le coût moyen d’une violation de données s’élevait à 4,45 millions de dollars, soit une augmentation de 15 % sur trois ans. Le rapport révèle également que les entreprises qui s’appuient largement sur l’IA de sécurité et l’automatisation économisent en moyenne 1,76 million de dollars américains.

Les entreprises déploient des mesures de sécurité des données pour améliorer la visibilité sur le stockage de leur données. Parmi les fonctions matérielles et logicielles de sécurité du stockage, citons les autorisations spéciales, le chiffrement, le masquage des données et l’occultation des fichiers sensibles. Les solutions logicielles de sécurité du stockage les plus récentes permettent également d’automatiser les rapports pour rationaliser les audits et assurer la conformité aux exigences réglementaires.

En outre, la cyber résilience, c’est-à-dire la capacité de l’entreprise à prévenir les incidents de cybersécurité, à y faire face et à récupérer, fait désormais partie intégrante de la sécurité du stockage de données et y apporte une toute nouvelle dimension. En effet, la cyber résilience associe continuité d’activité et reprise après sinistre (BCDR),sécurité des systèmes d’information et résilience organisationnelle pour aider les entreprises à faire face aux menaces et à protéger leurs données.

Aujourd’hui, les secteurs qui conservent des données dont ils doivent assurer l’intégrité (par exemple, la santé ou le secteur public) peuvent opter pour un stockage immuable, qui protège les données en empêchant toute modification ou altération pendant une durée définie ou indéterminée. Ces systèmes de fichiers permettent d’accéder de manière répétée aux données stockées, mais pas de les modifier, et les protègent contre la falsification, les cyberattaques et les rançongiciels.

 
Solutions connexes
IBM Storage DS8000

IBM Storage DS8000 est le système de stockage le plus fiable et le mieux sécurisé pour les serveurs IBM zSystems et IBM Power.

Découvrir Storage DS8000
Solutions de stockage de données d’entreprise

IBM Storage est une famille de matériel de stockage de données, de stockage défini par logiciel et de logiciels de gestion du stockage.

Découvrir les solutions de stockage de données
Services de support matériel et logiciel  

IBM fournit un support proactif pour les serveurs Web et l’infrastructure des centres de données afin de réduire les temps d’arrêt et d’améliorer la disponibilité informatique.

Services de serveurs Web
Passez à l’étape suivante

De la gestion des environnements de cloud hybride au maintien de la résilience des données, les solutions de stockage IBM vous offrent un nouvel éclairage sur vos données tout en assurant une protection robuste contre les menaces.

Découvrir les solutions de stockage de données Découvrir le produit