Cluster Online — AWS us-east-1

Cloud Operations
Localiza&Co SRE

Infraestrutura multicloud de alto desempenho com AWS EKS, Karpenter, Terraform e observabilidade completa. Projeto portfolio desenvolvido para a vaga de SRE/Cloud Engineer na Localiza&Co.

99.98% Uptime SLA
24 Pods Running
6 Nodes Ativos
12ms Latência P99

Arquitetura Cloud

Fluxo completo de tráfego — do usuário final até os pods no EKS

🌐
Internet
HTTPS
🛡️
Akamai CDN / WAF
TLS Offload
⚖️
AWS ALB API Gateway
Kubernetes Ingress
☸️
AWS EKS Karpenter Auto Scaling
Pod
Pod
Pod
+Pod
CloudWatch / SSM
📊
Observabilidade CloudWatch · Logs · Metrics

Componentes AWS

  • 🏗️
    VPC + Subnets 2 AZs, público + privado, NAT Gateway
  • ☸️
    EKS 1.29 Managed node groups + Karpenter
  • 🔐
    IAM + IRSA Least privilege, OIDC provider
  • ⚖️
    ALB Controller Ingress gerenciado, SSL ACM
  • 📡
    CloudWatch Logs, Metrics, Alarms, Dashboards
  • 🔧
    SSM Parameter Store Secrets e configurações seguras

Métricas do Cluster

Dados em tempo real dos nodes e workloads no EKS

CPU Utilization OK
38%
Memory Usage OK
61%
Requests / sec OK
1.2k
Error Rate OK
0.02%

Node Status

Node Tipo Status CPU Memória Pods Provisionado por

Karpenter Activity

Log de eventos de provisionamento e otimização de custo

Economia Spot
67%
vs On-Demand
Nodes Provisionados
14
Última hora
Tempo Médio
8s
Para novo node
Interrupções Spot
3
Migradas sem impacto

CI/CD Pipeline

Deploy automatizado do código até o cluster EKS

📝
Code Push
git push origin main
2s atrás
🐳
Docker Build
docker build + push ECR
45s
🏗️
Terraform Apply
infra atualizada
1m 22s
☸️
kubectl rollout
deployment/localiza-app
00:23
Health Check
Aguardando pods Ready
📋 Output do pipeline Live
[10:42:01] Workflow triggered by push to main
[10:42:03] Checking out repository...
[10:42:05] AWS credentials configured
[10:42:08] Building Docker image: localiza-app:sha-a3f92c
[10:42:41] Image pushed to ECR successfully
[10:43:06] Running terraform plan...
[10:43:48] Plan: 0 to add, 1 to change, 0 to destroy
[10:44:10] terraform apply complete
[10:44:13] Updating EKS deployment image...
[10:44:35] Waiting for rollout...

Stack Completa

AWS
EC2, EKS, ALB, CloudWatch, IAM, SSM, ECR, API Gateway
Kubernetes / EKS
Clusters produção, troubleshooting, admission controllers, network policies, service meshes
Karpenter
NodePool, NodeClass, Spot/On-Demand, otimização de custo e disponibilidade
Terraform
Módulos reutilizáveis, state remoto S3, pipelines CI/CD, GitOps
Linux
Red Hat, Ubuntu — automação, hardening, troubleshooting kernel/processos
Akamai
CDN, cache rules, WAF, análise de performance e segurança web global
F5
iRules, SSL offloading, políticas de tráfego, balanceamento crítico
CI/CD / GitOps
GitHub Actions, pipelines multi-stage, deploy EKS automatizado