O auto-scaling é utilizado para garantir que os aplicativos tenham os recursos necessários para manter disponibilidade consistente e atingir metas de desempenho, além de promover o uso eficiente de recursos em nuvem e minimizar os custos em nuvem. De acordo com um white paper de 2023 da Infosys, as organizações que migram para a nuvem desperdiçam cerca de 32% do custo da nuvem.1 Devido ao seu foco na utilização eficiente de recursos, o auto-scaling é um componente muito útil para uma prática bem-sucedida de FinOps.
Quando as organizações configuram a infraestrutura de nuvem, elas fornecem recursos de acordo com as necessidades de recursos de computação, armazenamento e rede. Mas a demanda flutua, digamos, com picos ou quedas no tráfego de rede ou uso de aplicativos. Os recursos de auto-scaling permitem que os recursos sejam ajustados para corresponder à demanda em tempo real de acordo com métricas específicas, como utilização da CPU ou disponibilidade de largura de banda, sem intervenção humana.
O auto-scaling pode ser utilizado para otimizar a alocação de recursos por meio de uma variedade de métodos, como o dimensionamento preditivo, que utiliza dados históricos para prever a demanda futura ou o dimensionamento dinâmico, que reage às necessidades de recursos em tempo real, conforme determinado pelas políticas de auto-scaling de uma organização. As políticas de auto-scaling automatizam os ciclos de vida de instâncias de computação em nuvem, iniciando e encerrando virtual machines conforme necessário para ajudar na demanda de recursos. O auto-scaling é frequentemente usado em conjunto com o balanceamento de carga elástico para aproveitar totalmente os recursos de nuvem disponíveis.