Computação

AWS Auto Scaling

Escale automaticamente sua capacidade para cima e para baixo conforme a demanda

O que é Auto Scaling?

O AWS Auto Scaling monitora suas aplicações e ajusta automaticamente a capacidade para manter performance estável e previsível ao menor custo possível. Quando a demanda sobe, ele adiciona recursos; quando cai, remove o excesso.

O serviço mais usado é o EC2 Auto Scaling, que gerencia grupos de instâncias EC2 (Auto Scaling Groups — ASG). Mas o Auto Scaling também funciona com ECS, DynamoDB, Aurora e outros serviços via Application Auto Scaling.

UsuáriosELB (Load Balancer)Auto Scaling Group ├── EC2 instância 1 ← sempre ativa ├── EC2 instância 2 ← sempre ativa ├── EC2 instância 3 ← adicionada quando CPU > 70% └── EC2 instância 4 ← adicionada em pico de tráfego ↑ CloudWatch Alarm → dispara política de scaling

Auto Scaling Group (ASG)

Um Auto Scaling Group é uma coleção de instâncias EC2 tratadas como uma unidade lógica. Você define:

Políticas de Scaling

PolíticaComo funcionaCaso de uso
Target Tracking Mantém uma métrica em um valor alvo (ex: CPU em 50%). O ASG ajusta automaticamente. Mais simples e recomendada para a maioria dos casos
Step Scaling Adiciona ou remove instâncias em "degraus" conforme o tamanho do alarme CloudWatch. Quando você precisa de controle granular sobre a resposta ao scaling
Scheduled Scaling Escala em horários predefinidos (ex: aumentar às 8h, reduzir às 20h). Cargas previsíveis — pico de segunda a sexta, promoções agendadas
Predictive Scaling Usa ML para prever demanda futura e provisiona instâncias com antecedência. Workloads com padrões cíclicos — evita lag no scale-out

Scale-Out vs Scale-In

O Auto Scaling EC2 é sempre horizontal — adiciona e remove instâncias, não muda o tipo.

Integração com ELB

O Auto Scaling funciona em conjunto com o Elastic Load Balancer:

Health Checks

O ASG monitora a saúde das instâncias de duas formas:

Instâncias marcadas como não saudáveis são terminadas e substituídas automaticamente.

Cooldown Period

Após uma atividade de scaling, o ASG aguarda um período de cooldown (padrão: 300 segundos) antes de executar outra ação. Isso evita que o grupo escale repetidamente antes que as novas instâncias estejam totalmente operacionais.

Application Auto Scaling

Além do EC2, o Auto Scaling funciona com outros serviços:

ServiçoO que escala
ECSNúmero de tasks (containers)
DynamoDBRead/Write Capacity Units
AuroraNúmero de réplicas de leitura
LambdaConcorrência provisionada
Spot FleetNúmero de instâncias Spot

⭐ Pontos Importantes para o Exame