Inicio Topics Escalado automático ¿Qué es el Auto-Scaling?
Explore la optimización de costes de la nube
Ilustración que representa una infraestructura de nube híbrida

Publicado: 12 Diciembre 2023
Colaboradores: Gita Jackson, Michael Goodwin

¿Qué es el Auto-Scaling?

El Auto-Scaling, a veces denominado "escalado automático", es una característica del cloud computing que se utiliza para asignar automáticamente recursos informáticos en función de la demanda del sistema. 

El Auto-Scaling se utiliza para garantizar que las aplicaciones dispongan de los recursos necesarios para mantener una disponibilidad constante y cumplir los objetivos de rendimiento. También promueve el uso eficiente de los recursos de la nube y minimiza su coste. Según un informe técnico de Infosys de 2023, las organizaciones que migran a la nube desperdician alrededor del 32% de sus costes en la nube.1 Al centrarse en la utilización eficiente de los recursos, el Auto-Scaling es un componente útil en el marco de una FinOps exitosa.

Al configurar una infraestructura en la nube, las organizaciones asignan recursos basándose en una línea base de requisitos de recursos informáticos, de almacenamiento y de red. . Sin embargo, la demanda puede fluctuar, por ejemplo, debido a picos o caídas en el tráfico de red o en el uso de las aplicaciones. Las características de Auto-Scaling permiten ajustar los recursos a la demanda en tiempo real en función de métricas específicas como la utilización de la CPU o la disponibilidad de ancho de banda, sin necesidad de intervención humana.

El Auto-Scaling puede utilizarse de varias formas para optimizar la asignación de recursos. Por ejemplo, el escalado predictivo, que utiliza datos históricos para predecir la demanda futura, o el escalado dinámico, que responde en tiempo real a las necesidades de recursos determinadas por las políticas de Auto-Scaling de la organización. Las políticas de Auto-Scaling automatizan los ciclos de vida de las instancias de cloud computing, iniciando y deteniendo las máquinas virtuales según sea necesario para satisfacer las necesidades de recursos. El Auto-Scaling se utiliza a menudo junto con el equilibrio de carga elástico para optimizar el uso de los recursos disponibles en la nube.

Explorar la demostración interactiva de IBM Turbonomic

Limite los gastos relacionados con la nube manteniendo el rendimiento de las aplicaciones gracias a las herramientas automatizables para la optimización de costes en la nube.

Contenido relacionado

Suscríbase al boletín de IBM

Balanceo de carga frente a Auto-Scaling

Aunque el Auto-Scaling está relacionado con el balanceo de carga, no son exactamente lo mismo. Ambos procesos influyen en la asignación de recursos del back-end y se utilizan para optimizar el rendimiento y evitar el sobreaprovisionamiento. A menudo se utilizan juntos.

Los balanceadores de carga distribuyen el tráfico de datos entrante entre varios servidores. Esto reduce la carga de un servidor en particular. Los balanceadores de carga suelen ofrecer características como comprobaciones de salud que ayudan a redirigir el tráfico lejos de las instancias poco saludables y hacia las instancias saludables. En un entorno de nube, el balanceo de carga ayuda a mejorar el rendimiento de las aplicaciones.

El Auto-Scaling, por su parte, ajusta la capacidad del sistema según sea necesario para garantizar un rendimiento constante y evitar la sobreutilización de los recursos (es decir, utilizando sólo los recursos que realmente se necesitan). Con el Auto-Scaling, se añaden (o desactivan) nuevos servidores o instancias informáticas en función de las necesidades de recursos y de las políticas de autoescalado establecidas por la organización.

Cómo funciona el Auto-Scaling

La mayoría de los proveedores de servicios en la nube, como IBM Cloud, Amazon Web Services (a veces denominada AWS Cloud), Microsoft Azure y Oracle Cloud Infrastructure, ofrecen servicios de Auto-Scaling para sus plataformas en la nube. Estos servicios ayudan a las organizaciones a configurar políticas de Auto-Scaling para satisfacer las necesidades y objetivos de computación en nube de la organización.

Diferentes proveedores y plataformas ofrecen características, capacidades y tarificación diferentes, por lo que las organizaciones disponen de recursos y casos de uso distintos. En general, sin embargo, el Auto-Scaling funciona de la siguiente manera:

El proceso comienza con una configuración inicial o implementación básica, en la que se proporciona un tipo (o tipos) de instancia con unas determinadas características de capacidad y rendimiento. Esto suele hacerse mediante llamadas a la API e infraestructura como código (IaC), un proceso en el que se utiliza código para aprovisionar y configurar los elementos de la infraestructura de TI de acuerdo con especificaciones predefinidas.

Las organizaciones determinarán la capacidad deseada y qué tipo de atributos necesita la instancia en función de la carga de trabajo esperada para esa instancia. Al configurar una política de autoescalado, las organizaciones pueden establecer objetivos y umbrales para el uso de la informática, el almacenamiento o la red que, cuando se alcancen, desencadenarán automáticamente una acción específica para ajustar con mayor precisión las necesidades de recursos actuales. Si se desea, las políticas pueden configurarse para enviar una notificación al usuario cada vez que se desencadene una acción de escalado.

Grupos de Auto-Scaling

Las organizaciones también pueden crear grupos de instancias para mantener un número mínimo o máximo de instancias para cargas de trabajo específicas o agrupar distintos tipos de instancias para gestionar diferentes cargas de trabajo. Los tipos de instancias incluyen:2

Instancias de uso general

Las instancias de uso general están diseñadas para una gran variedad de cargas de trabajo, como servidores web, bases de datos pequeñas y entornos de desarrollo y pruebas.

Instancias optimizadas para computación

Estas instancias están optimizadas para cargas de trabajo que requieran un cálculo intensivo, como la computación de alto rendimiento, el procesamiento por lotes y la modelización científica. Estas instancias maximizan la potencia de cálculo utilizando GPUs y CPUs con un elevado número de núcleos.

Instancias optimizadas para memoria

Estas instancias con elevados requisitos de memoria están optimizadas para cargas de trabajo intensivas en memoria, como bases de datos de alto rendimiento, cachés distribuidas en memoria y proceso de datos en tiempo real/analytics de big data.

Instancias optimizadas para almacenamiento

Estas instancias están optimizadas para cargas de trabajo intensivas en memoria como big data, almacenamiento de datos y procesamiento de registros. Utilizan cachés de alta capacidad y unidades de estado sólido (SSD) para soportar las actividades intensivas de lectura y escritura de las cargas de trabajo.


Los grupos de Auto-Scaling con tipos de instancia mixtos permiten a los equipos de CloudOps y DevOps satisfacer las necesidades de recursos con mayor precisión y eficacia. Por ejemplo, si las necesidades de ancho de banda se satisfacen adecuadamente, pero la utilización de la CPU ha superado el umbral establecido en las políticas de Auto-Scaling, se pueden poner en marcha instancias específicas de la máquina mientras que las instancias dedicadas al el tráfico de red permanecen inalteradas.

Una vez que los equipos conocen los requisitos relativos a la carga de trabajo, pueden incluso crear plantillas de configuración de arranque para nuevas instancias. Estas plantillas definen el tipo de instancia, los parámetros de configuración y otras directrices para el lanzamiento de nuevas instancias y cómo contribuyen al entorno global de la nube. De este modo, las organizaciones pueden automatizar por completo el ciclo de vida de las máquinas virtuales.

Tipos de Auto-Scaling

Existen varios tipos y diferentes métodos de Auto-Scaling:

Escalado horizontal

El escalado horizontal, o "scaling out", implica añadir más máquinas o nodos a un entorno de cloud computing. También existe el scale in, que consiste en reducir el número de nodos del entorno.

Escalado vertical

El escalado vertical, o "scaling up", es el proceso de añadir más potencia, por ejemplo, RAM, CPU o almacenamiento, a los nodos existentes en su entorno actual de cloud computing.

Las políticas de Auto-Scaling pueden ser predictivas, dinámicas o programadas.

Escalado predictivo

Las políticas de escalado predictivo utilizan la inteligencia artificial (IA) y el machine learning para anticiparse a las necesidades futuras de recursos antes de que se produzcan, basándose en el historial de utilización.

Por ejemplo, una política de Auto-Scaling predictiva podría identificar la probabilidad de un aumento del tráfico web para una empresa de comercio electrónico de cara a una campaña de compras navideñas y reducir o aumentar la escala de acuerdo con la política establecida. Esto ayudaría a minimizar de forma proactiva la latencia de la red y el tiempo de inactividad.

Escalado dinámico

Las políticas de escalado dinámico reaccionan a las necesidades de recursos a medida que se producen, ajustando la asignación de recursos en función de la utilización en tiempo real. Con una política de Auto-Scaling dinámica, las organizaciones pueden enviar más recursos a un nodo o grupo de Auto-Scaling concreto o poner en marcha instancias adicionales cuando se alcanza un umbral específico, como un porcentaje de uso de la CPU.

Por ejemplo, si una organización ejecuta una aplicación web que consume muchos recursos en un horario irregular, podría utilizarse una política de escalado dinámico para ajustar la disponibilidad de recursos en función de las necesidades. El escalado dinámico suele ir acompañado de un periodo de enfriamiento, en el que los recursos incrementados permanecen disponibles en caso de que se produzcan picos de tráfico adicionales.

Escalado programado

Las políticas de Auto-Scaling programado asignan los recursos según un calendario predeterminado. Por ejemplo, si una organización sabe que el tráfico o la demanda de recursos es mucho mayor por las tardes que por las mañanas, se puede establecer una política de Auto-Scaling para adaptarse a esa demanda.

Beneficios del Auto-Scaling

Cuando se aplica con eficacia, el Auto-Scaling puede desempeñar un papel importante en la optimización del entorno de cloud computing de una organización y en la reducción de los costes generales de la nube.

Al establecer sólidas políticas de Auto-Scaling, las organizaciones pueden reducir su dependencia del aprovisionamiento manual y garantizar un rendimiento más constante del sistema.

Minimizar la configuración manual de la infraestructura

El Auto-Scaling permite que un entorno de nube reaccione en tiempo real a la demanda de recursos sin necesidad de intervención humana. Esto es sencillamente más eficaz que el escalado manual. Contribuye a reducir el agotamiento de los empleados, mejora la coherencia de la configuración y el aprovisionamiento y libera tiempo del personal para tareas más valiosas.

Aumente la escalabilidad

El Auto-Scaling permite a las organizaciones ampliar su entorno y sus capacidades de cloud computing de manera fluida, sin tener que dedicar personal adicional a la supervisión y el aprovisionamiento de recursos.

Proporcione un rendimiento consistente

Al garantizar que un entorno de nube dispone de los recursos de computación, red y almacenamiento que necesita, independientemente de la actividad o la demanda, el Auto-Scaling permite mantener el rendimiento constante y fiable de los servicios en la nube.

Mejore la experiencia del usuario

Un rendimiento más constante de la aplicación web y de la red se traduce en un nivel de servicio más estable para el usuario.

Reducir los costes del cloud computing

Cuando confían en el aprovisionamiento manual de recursos, las organizaciones a menudo sobreaprovisionan por precaución, sólo para asegurarse de que los recursos estén disponibles para los picos de demanda. Gracias a una plataforma capaz de escalar automáticamente los recursos informáticos, de red y de almacenamiento para satisfacer la demanda en tiempo real, las organizaciones pueden evitar el sobreaprovisionamiento y utilizar sólo lo necesario, con la consiguiente reducción de la factura de la nube y un mayor ROI.

Soluciones relacionadas
Optimización del coste de la nube con IBM Turbonomic

Mediante las soluciones de automatización y optimización de la nube basadas en IA de la plataforma IBM Turbonomic, contribuye de forma continua a garantizar el rendimiento de las aplicaciones (tanto tradicionales como nativas en cloud) y a optimizar los costes. Las herramientas de la plataforma para la gestión de los costos en la nube funcionan en entornos de nube pública, privada, multinube o híbrida además de en la nube de cualquiera de los proveedores de servicios en la nube más importantes. 

Explore la optimización de costes de la nube con IBM Turbonomic Pruebe Turbonomic gratis

IBM Turbonomic

La plataforma de optimización de costes de nube híbrida IBM Turbonomic le permite automatizar continuamente acciones críticas en tiempo real que ofrecen de forma proactiva el uso más eficiente de los recursos informáticos, de almacenamiento y de red a sus aplicaciones en cada capa de la pila. 

Explore IBM Turbonomic Pruebe la demostración interactiva
Recursos Carhartt: una marca legendaria logra un récord de ventas en vacaciones

Descubra cómo Carhartt utilizó el software de optimización de costes de nube híbrida IBM Turbonomic para ayudar a su infraestructura de nube híbrida a gestionar nuevos y espectaculares picos de demanda.

Buenas prácticas para elegir una solución de cloud optimization

Lea este informe exclusivo de PeerPaper, que incluye las mejores prácticas, basadas en las opiniones de expertos del sector y en los comentarios de usuarios verificados de IBM Turbonomic.

AIOps más inteligentes

Deje que la automatización con IA trabaje para su empresa y le permita garantizar el rendimiento de las aplicaciones.

Operacionalizar la automatización de FinOps

Lea esta guía rápida para explorar la creciente disciplina de gestión financiera en la nube para FinOps.

Información general de IBM Turbonomic

Descubra cómo la gestión de recursos de aplicaciones convierte la observabilidad en acción con la automatización impulsada por IA.

Documentación de IBM Turbonomic

Explorar la documentación de todas las versiones de la plataforma IBM.

Dé el siguiente paso

IBM Turbonomic le permite ejecutar aplicaciones de manera fluida, continua y rentable para ayudar a lograr un rendimiento eficiente de las aplicaciones y, al mismo tiempo, reducir los costos.

Explore Turbonomic Solicite una demo gratuita
Notas a pie de página

Cloud cost optimization" ( el enlace reside fuera de ibm.com), Sarika Nandwani, Infosys.com, 2023

AWS EC2 instance types: Challenges and best practices for hosting your application in AWS,” Christopher Graham, 23 de agosto de 2023