Inicio topics Escalado automático ¿Qué es el autoescalado?
Conozca la optimización de la nube
Ilustración de infraestructura de nube híbrida

Publicado: 12 de diciembre de 2023
Colaboradores: Gita Jackson, Michael Goodwin

¿Qué es el autoescalado?

El autoescalado, conocido ocasionalmente como "escalado automático", es una característica de computación en la nube que asigna automáticamente los recursos computacionales en función de la demanda del sistema. 

El autoescalado se utiliza para garantizar que las aplicaciones tengan los recursos que necesitan para mantener una disponibilidad constante y alcanzar los objetivos de rendimiento, así como para promover el uso eficiente de los recursos de la nube y minimizar los costos de esta. Según un informe técnico de Infosys de 2023, las organizaciones que migran a la nube desperdician alrededor del 32 % de su costo en la nube.1 Debido a su enfoque en la utilización eficiente de recursos, el autoescalado es un componente útil en una práctica de FinOps exitosa.

Cuando las organizaciones configuran la infraestructura en la nube, proveen recursos de acuerdo con una “línea base” de cómputo, almacenamiento de información y necesidades de recursos de red. Pero la demanda fluctúa, por ejemplo, con picos o caídas en el tráfico de la red o en el uso de aplicaciones. Las funciones de autoescalado permiten que los recursos se escalen para satisfacer la demanda en tiempo real de acuerdo con métricas específicas, como la utilización de CPU o la disponibilidad de ancho de banda, sin intervención humana.

El autoescalado se puede utilizar para optimizar la asignación de recursos a través de una variedad de medios, como el escalado predictivo, que utiliza datos históricos para predecir la demanda futura, o el escalado dinámico, que reacciona a las necesidades de recursos en tiempo real, según lo determinado por las políticas de autoescalado de una organización. Estas automatizan los ciclos de vida de las instancias de computación en la nube, lanzando y terminando máquinas virtuales según sea necesario para ayudar con la demanda de recursos. El autoescalado a menudo se utiliza en conjunto con el equilibrio de carga elástico para aprovechar al máximo los recursos disponibles en la nube.

Explorar la demostración interactiva de IBM Turbonomic

Contenga el gasto de la nube mientras conserva el rendimiento de las aplicaciones con herramientas automatizables de optimización de costos de la nube.

Contenido relacionado

Suscríbase al boletín de IBM

Equilibrio de carga frente a autoescalado

Si bien el autoescalado está relacionado con el equilibrio de carga, no son iguales. Ambos procesos afectan la asignación de recursos de backend, y se utilizan para optimizar el rendimiento y evitar el sobreaprovisionamiento. A menudo se usan juntos.

Los equilibradores de carga distribuyen el tráfico entrante entre varios servidores para reducir la carga en cualquier servidor en particular. Suelen ofrecer funciones, como comprobaciones estado, que ayudan a dirigir el tráfico lejos de las instancias no saludables y hacia las saludables. Equilibrar la carga de tráfico ayuda a mejorar el rendimiento de las aplicaciones en un entorno de nube.

El autoescalado, por el contrario, ajusta la capacidad del sistema en función de la demanda para mantener un rendimiento constante y evitar el aprovisionamiento excesivo de recursos (es decir, usar solo lo que se necesita). Agrega nuevos servidores o instancias informáticas (o los termina) de acuerdo con la demanda de recursos y las políticas de autoescalado que ha establecido una organización.

Cómo funciona el autoescalado

La mayoría de los proveedores de nube, como IBM Cloud, Amazon Web Services (a veces, denominados AWS Cloud), Microsoft Azure y Oracle Cloud Infrastructure ofrecen servicios de autoescalado en sus plataformas de nube. Estos servicios pueden ayudar a las organizaciones a configurar políticas de autoescalado para satisfacer las necesidades y los objetivos de computación en la nube de la organización.

Los diferentes proveedores y plataformas ofrecen diferentes características, capacidades y precios, y las organizaciones tendrán diferentes recursos disponibles y diferentes casos de uso, pero generalmente el autoescalado funciona de la siguiente manera:

El proceso comienza con una configuración de lanzamiento, o despliegue de línea de base, en la que se despliegan uno o más tipos de instancia con una capacidad y características de rendimiento específicas. A menudo, se hace usando llamadas API e infraestructura como código (IaC), un proceso que aprovecha el código para aprovisionar y configurar elementos de infraestructura de TI en especificaciones predefinidas.

Las organizaciones determinarán la capacidad deseada y qué tipo de atributos necesita la instancia en función de la carga de trabajo esperada para esa instancia. Al configurar una política de autoescalado, las organizaciones pueden establecer objetivos y umbrales para calcular, almacenar o usar la red que, cuando se cumplen, activan automáticamente una acción especificada para adaptarse a las demandas actuales de recursos con mayor precisión. Si se desea, las políticas se pueden configurar para que se envíen notificaciones cada vez que se inicie una acción de escalado.

Grupos de autoescalado

Las organizaciones también pueden configurar grupos de instancias que mantengan un número mínimo o máximo de instancias para cargas de trabajo específicas, o agrupar diferentes tipos de instancias para manejar diferentes tipos de cargas de trabajo. Los tipos de instancias incluyen:2

Instancias de propósito general

Los tipos de instancias de propósito general están diseñados para una variedad de cargas de trabajo, incluidos servidores web, bases de datos pequeñas y entornos de desarrollo y pruebas.

Calcular instancias optimizadas

Estas instancias están optimizadas para cargas de trabajo de computación intensiva, como computación de alto rendimiento, procesamiento por lotes y modelado científico. Estas instancias maximizan la potencia de cálculo con GPU y CPU de alto número de núcleos.

Instancias optimizadas para la memoria

Estas instancias de alta memoria están optimizadas para cargas de trabajo que requieren mucha memoria, como bases de datos de alto rendimiento, cachés en memoria distribuidas y procesamiento de datos en tiempo real/análisis de big data.

Instancias optimizadas para almacenamiento

Estas instancias están optimizadas para cargas de trabajo de almacenamiento intensivo, como big data, almacenamiento de datos y procesamiento de registros. Aprovechan el almacenamiento en caché de alta capacidad y las unidades de estado sólido (SSD) para admitir las intensas actividades de lectura y escritura de las cargas de trabajo.


Los grupos de autoescalado con tipos de instancias mixtas permiten a los equipos de CloudOps y DevOps satisfacer las demandas de recursos de manera más precisa y eficiente. Por ejemplo, si las necesidades de ancho de banda están adecuadamente cubiertas, pero el uso de CPU ha superado el umbral establecido en las políticas de autoescalado, las instancias específicas de computación pueden ponerse en marcha mientras que las instancias dedicadas a gestionar el tráfico de red permanecen como están.

Una vez que los equipos comprenden la demanda de cargas de trabajo, incluso pueden crear plantillas de configuración de lanzamiento para nuevas instancias. Estas plantillas definen el tipo de instancia, los parámetros de configuración y otras políticas para la puesta en marcha de nuevas instancias y cómo contribuyen al entorno general de la nube. Esto permite a las organizaciones automatizar por completo los ciclos de vida de las máquinas virtuales.

Tipos de autoescalado

Hay un par de tipos diferentes de escalado, así como diferentes métodos de autoescalado:

Escalado horizontal

El escalado horizontal implica agregar más máquinas o nodos a un entorno de computación en la nube. También puede escalar reduciendo el número de nodos en el entorno.

Escalado vertical

El escalado vertical es el proceso de agregar más energía (RAM, CPU, almacenamiento, por ejemplo) a los nodos existentes en su entorno de computación en la nube actual.

Las políticas de autoescalado pueden ser predictivas, dinámicas o programadas.

Escalado predictivo

Las políticas de escalado predictivo utilizan inteligencia artificial (IA) y aprendizaje automático para anticipar futuras necesidades de recursos antes de que ocurran en función de la utilización histórica.

Por ejemplo, una política predictiva de escalado automático puede identificar la probabilidad de un mayor tráfico web para una empresa de comercio electrónico antes de una temporada de compra navideña y escalar de acuerdo con la política establecida. Esto puede ayudar a minimizar proactivamente la latencia de la red y el tiempo de inactividad.

Escalado dinámico

Las políticas de escalado dinámico reaccionan a las necesidades de recursos a medida que ocurren, ajustando la asignación de recursos en función de la utilización en tiempo real. Con una política de escalado dinámico, las organizaciones pueden enviar más recursos a un nodo en particular o a un grupo de autoescalado, o acelerar instancias adicionales cuando se alcanza un umbral específico, como un porcentaje del uso de CPU.

Por ejemplo, si una organización ejecuta una aplicación web que consume recursos significativos en una programación irregular, se podría usar una política de escalado dinámico para ajustar la disponibilidad de recursos según sea necesario. El escalado dinámico suele ir acompañado de un periodo de enfriamiento, en el que los recursos aumentados permanecen disponibles en caso de que se produzcan picos de tráfico adicionales.

Escalado programado

Las políticas de autoescalado programado asignan recursos según un horario predeterminado. Por ejemplo, si una organización sabe que la demanda de tráfico o recursos es mucho mayor por las tardes que por la mañana, se puede establecer una política de autoescalado para adaptarse a esa demanda.

Beneficios del autoescalado

Cuando se implementa de manera eficaz, el autoescalado puede desempeñar un papel importante en la optimización del entorno de computación en la nube de una organización y la reducción de los costos generales de la nube.

Al establecer políticas sólidas de autoescalado, las organizaciones pueden reducir su dependencia del aprovisionamiento manual y garantizar un rendimiento más constante del sistema.

Minimizar la configuración manual de la infraestructura

El autoescalado permite que un entorno en la nube reaccione en tiempo real a la demanda de recursos sin necesidad de intervención humana. Esto es simplemente más eficiente que el escalado manual. Ayuda a reducir el agotamiento de los empleados, mejorar la congruencia de configuración y aprovisionamiento, y liberar tiempo de los empleados para tareas más valiosas.

Aumenta la escalabilidad

El autoescalado permite a las organizaciones expandir su entorno de computación en la nube y sus capacidades perfectamente, sin tener que dedicar personal adicional al monitoreo y aprovisionamiento de recursos.

Proporcionar un rendimiento constante

Al garantizar que un entorno en la nube tenga los recursos informáticos, de red y de almacenamiento que requiere, independientemente de la actividad o la demanda, el autoescalado ayuda a mantener el rendimiento constante y confiable de los servicios en la nube.

Mejore la experiencia del usuario

Un rendimiento más constante de las aplicaciones web y de la red significa un nivel de servicio más constante para el usuario.

Reducir los costos de la computación en la nube

Cuando se confía en el aprovisionamiento manual de recursos, las organizaciones a menudo sobreaprovisionan por precaución, solo para asegurarse de que los recursos están disponibles para los momentos de mayor demanda. Al usar una plataforma que puede escalar automáticamente los recursos de computación, red y almacenamiento para satisfacer la demanda en tiempo real, las organizaciones pueden evitar el sobreaprovisionamiento y usar solo lo que necesitan, lo que resulta en una menor factura en la nube y un mayor ROI.

Soluciones relacionadas
Optimización de costos de la nube con IBM Turbonomic

Mediante las soluciones de automatización y optimización de la nube impulsadas por la IA de la plataforma IBM® Turbonomic, puede ayudar continuamente a garantizar el rendimiento de las aplicaciones (tanto tradicionales como nativas de la nube) y optimizar los costos. Las herramientas de gestión de costos de la nube de la plataforma funcionan con entornos de nube pública, privada, múltiple e híbrida y con cualquiera de los principales proveedores de nube. 

Explorar la optimización de costos de la nube con IBM Turbonomic Pruebe Turbonomic gratis

IBM Turbonomic

La plataforma de optimización de costos de la nube híbrida IBM Turbonomic le permite automatizar continuamente acciones críticas en tiempo real que ofrecen de forma proactiva el uso más eficiente de los recursos informáticos, de almacenamiento y de red a sus aplicaciones en cada capa de la pila. 

Explorar IBM Turbonomic Pruebe la demostración interactiva
Recursos Carhartt: una marca legendaria logra ventas récord durante las fiestas

Descubra cómo Carhartt utilizó el software de optimización de costos de nube híbrida IBM Turbonomic para ayudar a su infraestructura de nube híbrida a gestionar nuevos y drásticos picos de demanda.

Mejores prácticas para elegir una solución de optimización de la nube

Lea el informe exclusivo de PeerPaper, que incluye las mejores prácticas basadas en opiniones de expertos de la industria y revisiones de usuarios verificados de IBM Turbonomic.

AIOps más inteligente

Ponga la automatización impulsada por IA a trabajar en su negocio para ayudar a garantizar el rendimiento de las aplicaciones.

Implementar la automatización de FinOps

Lea esta guía rápida para explorar la disciplina de administración financiera en la nube en rápido crecimiento de FinOps.

Descripción general de IBM Turbonomic

Descubra cómo la administración de los recursos de las aplicaciones convierte la observación en acción con la automatización de IA.

Documentación de IBM Turbonomic

Explore la documentación para todas las versiones de la plataforma IBM Turbonomic.

Dé el siguiente paso

IBM Turbonomic le permite ejecutar aplicaciones de manera fluida, continua y rentable para ayudar a lograr un rendimiento eficiente de las aplicaciones y reducir los costos.

Explore Turbonomic Reserve una demostración gratuita
Notas de pie de página

Cloud cost optimization" ( enlace externo a ibm.com), Sarika Nandwani, Infosys.com, 2023

AWS EC2 instance types: Challenges and best practices for hosting your application in AWS,” Christopher Graham, 23 de agosto de 2023