La plupart des fournisseurs de cloud, comme IBM Cloud, Amazon Web Services (parfois appelé AWS Cloud), Microsoft Azure et Oracle Cloud Infrastructure, proposent des services d’auto-scaling sur leurs plateformes cloud. Ces services peuvent aider les organisations à configurer des stratégies d’auto-scaling pour répondre à leurs besoins et objectifs en matière de cloud computing.
Différents fournisseurs et plateformes offrent différentes fonctionnalités, capacités et tarifications, et les organisations auront différentes ressources disponibles, pour différents cas d’utilisation, mais en général, voici comment l’auto-scaling fonctionne :
Le processus commence par une configuration de lancement, ou un déploiement de base, où un ou plusieurs types d’instances sont déployés avec des fonctionnalités spécifiques en termes de capacité et de performance. Cela requiert souvent des appels d’API et une infrastructure en tant que code (IaC), un processus qui exploite le code pour provisionner et configurer les éléments de l’infrastructure informatique selon des spécifications prédéfinies.
Les organisations détermineront la capacité souhaitée et le type d’attributs dont l’instance a besoin en fonction du workload attendu pour cette instance. Lors de la mise en place d’une politique d’auto-scaling , l’organisation peut définir des objectifs et des seuils pour l’utilisation des couches de calcul, de stockage ou de réseau, qui lorsqu’ils sont atteints, déclenchent automatiquement une action spécifique pour répondre plus précisément aux demandes actuelles en matière de ressources. Il est possible de configurer les politiques de manière à ce que des notifications soient envoyées à chaque fois qu’une action de dimensionnement est initiée.