O que é: O pilar de Excelência Operacional foca na capacidade de executar e monitorar sistemas para entregar valor de negócios e melhorar continuamente os processos e procedimentos de suporte.
Para que serve: Ajuda a gerenciar e automatizar operações, responder a eventos, definir padrões para operações diárias e melhorar continuamente os processos de entrega e operação.
Casos de uso:
Automação de implantações e gerenciamento de infraestrutura (Infraestrutura como Código).
Monitoramento proativo de aplicações e infraestrutura.
Implementação de práticas de CI/CD (Integração Contínua/Entrega Contínua).
Gerenciamento de mudanças e incidentes.
Definição de runbooks e playbooks para operações.
Principais pontos:
Automação: Automatizar tarefas repetitivas e implantações.
Observabilidade: Coletar métricas, logs e traces para entender o comportamento do sistema.
Respostas a eventos: Definir procedimentos para responder a eventos operacionais.
Melhoria contínua: Revisar e refinar processos regularmente.
Documentação: Manter documentação clara e atualizada.
Organização: Estruturar equipes e responsabilidades para operações eficazes.
O que é: O pilar de Segurança abrange a capacidade de proteger dados, sistemas e ativos para aproveitar as tecnologias de nuvem e melhorar sua postura de segurança.
Para que serve: Ajuda a proteger informações e sistemas, gerenciar identidades e acessos, detectar eventos de segurança, proteger a infraestrutura e responder a incidentes.
Casos de uso:
Implementação de controle de acesso baseado em funções (RBAC) com IAM.
Criptografia de dados em repouso e em trânsito.
Monitoramento de logs de segurança com CloudTrail e CloudWatch.
Proteção de rede com VPC, Security Groups e Network ACLs.
Resposta a incidentes de segurança e recuperação de desastres.
Principais pontos:
Gerenciamento de identidade e acesso: Princípio do privilégio mínimo, autenticação forte.
Controles de detecção: Monitoramento e auditoria de eventos de segurança.
Proteção de infraestrutura: Segurança em todas as camadas (rede, computação, armazenamento).
Proteção de dados: Criptografia, classificação de dados, proteção contra perda de dados.
Resposta a incidentes: Planos e procedimentos para lidar com eventos de segurança.
Comparativo com segurança on-premises:
Segurança na Nuvem (AWS): A AWS oferece uma vasta gama de serviços de segurança gerenciados (IAM, KMS, GuardDuty, Security Hub, WAF, Shield) que automatizam e simplificam a implementação de controles de segurança. O modelo de responsabilidade compartilhada da AWS significa que a AWS é responsável pela segurança da nuvem, e o cliente é responsável pela segurança na nuvem.
Segurança On-premises: Exige que as organizações gerenciem e mantenham toda a pilha de segurança, desde a segurança física até a segurança da aplicação, o que pode ser complexo, caro e exigir uma equipe especializada maior.
O que é: O pilar de Confiabilidade abrange a capacidade de uma carga de trabalho de executar sua função pretendida de forma correta e consistente quando esperado, mesmo diante de falhas.
Para que serve: Ajuda a projetar sistemas que podem se recuperar de falhas, escalar para atender à demanda e operar de forma resiliente em ambientes dinâmicos.
Casos de uso:
Implementação de arquiteturas multi-AZ (Availability Zone) e multi-região para alta disponibilidade.
Uso de balanceadores de carga para distribuir o tráfego e isolar falhas.
Configuração de Auto Scaling para lidar com picos de demanda e falhas de instância.
Implementação de backups e planos de recuperação de desastres (DR).
Testes de resiliência, como injeção de falhas (Chaos Engineering).
Principais pontos:
Fundamentos de recuperação: Projetar sistemas para se recuperar automaticamente de falhas.
Recuperação de falhas: Implementar mecanismos para detectar e se recuperar de falhas.
Escalabilidade: Projetar sistemas para escalar horizontalmente e verticalmente.
Gerenciamento de mudanças: Implementar processos para gerenciar mudanças de forma segura.
Testes de resiliência: Testar a capacidade do sistema de resistir a falhas.
Comparativo com sistemas on-premises:
Confiabilidade na Nuvem (AWS): A AWS oferece recursos nativos (AZs, Regiões, Auto Scaling, ELB, RDS Multi-AZ) que facilitam a construção de arquiteturas altamente disponíveis e resilientes, sem a necessidade de investir em infraestrutura física redundante. A capacidade de provisionar recursos sob demanda e automatizar a recuperação de falhas é uma grande vantagem.
Confiabilidade On-premises: Exige um investimento significativo em hardware redundante, data centers secundários e processos manuais para garantir a confiabilidade, o que pode ser caro e complexo de manter.
O que é: O pilar de Eficiência de Performance foca na capacidade de usar recursos de computação de forma eficiente para atender aos requisitos do sistema e manter essa eficiência à medida que a demanda muda.
Para que serve: Ajuda a selecionar os tipos de recursos certos, monitorar o desempenho e otimizar a alocação de recursos para garantir que as cargas de trabalho operem de forma eficiente e econômica.
Casos de uso:
Seleção de tipos de instância EC2 e volumes EBS apropriados para a carga de trabalho.
Uso de serviços gerenciados (RDS, Lambda, S3) para otimizar o desempenho e reduzir a sobrecarga operacional.
Implementação de caching com Amazon ElastiCache ou Amazon CloudFront.
Monitoramento de desempenho com Amazon CloudWatch e AWS X-Ray.
Otimização de consultas de banco de dados e algoritmos de aplicação.
Principais pontos:
Democratizar tecnologias avançadas: Usar tecnologias que antes eram complexas e caras.
Ir global em minutos: Implantar em várias regiões para reduzir a latência.
Arquiteturas sem servidor: Reduzir a necessidade de gerenciar servidores.
Experimentar com mais frequência: Testar diferentes configurações para otimizar o desempenho.
Considerar o custo: Otimizar o desempenho sem comprometer o custo.
Comparativo com otimização de desempenho on-premises:
Eficiência de Performance na Nuvem (AWS): A AWS oferece uma vasta gama de opções de recursos (tipos de instância, armazenamento, rede) que podem ser facilmente ajustados para atender aos requisitos de desempenho. A capacidade de escalar recursos sob demanda e usar serviços gerenciados permite otimizar o desempenho de forma mais ágil e econômica.
Otimização de desempenho On-premises: Geralmente envolve a compra e o provisionamento de hardware, o que pode ser um processo demorado e caro. A escalabilidade é limitada pela capacidade física e a otimização pode exigir um esforço manual significativo.
O que é: O pilar de Otimização de Custos foca na capacidade de executar sistemas para entregar valor de negócios ao menor preço possível.
Para que serve: Ajuda a entender e controlar os custos da AWS, otimizar o uso de recursos e maximizar o valor de seus investimentos na nuvem.
Casos de uso:
Seleção de modelos de precificação (On-Demand, Reserved Instances, Savings Plans, Spot Instances).
Dimensionamento correto de recursos para evitar o superprovisionamento.
Identificação e eliminação de recursos ociosos ou subutilizados.
Uso de serviços gerenciados e sem servidor para reduzir a sobrecarga operacional e os custos.
Monitoramento de custos com AWS Cost Explorer e AWS Budgets.
Principais pontos:
Implementar gerenciamento financeiro na nuvem: Acompanhar e controlar os gastos.
Adotar um modelo de consumo: Pagar apenas pelo que usar.
Medir a eficiência geral: Monitorar o uso de recursos e o desempenho.
Parar de gastar dinheiro em trabalho indiferenciado: Focar em atividades que agregam valor ao negócio.
Analisar e atribuir gastos: Entender onde o dinheiro está sendo gasto.
Comparativo com gerenciamento de custos on-premises:
Otimização de Custos na Nuvem (AWS): A nuvem oferece flexibilidade para ajustar os recursos conforme a demanda, permitindo otimizar os custos de forma dinâmica. Modelos de precificação variados (pagamento por uso, instâncias reservadas, spot) e ferramentas de gerenciamento de custos (Cost Explorer, Budgets) facilitam a otimização.
Gerenciamento de custos On-premises: Envolve um alto investimento inicial em hardware e infraestrutura, com custos fixos que podem ser difíceis de otimizar. A capacidade de ajustar a capacidade é limitada, o que pode levar a superprovisionamento ou subutilização de recursos.
O que é: O pilar de Sustentabilidade foca em minimizar os impactos ambientais da execução de cargas de trabalho na nuvem, especialmente o consumo de energia e a eficiência.
Para que serve: Ajuda a projetar, desenvolver e implantar cargas de trabalho na nuvem de forma mais sustentável, reduzindo o consumo de recursos e a pegada de carbono.
Casos de uso:
Otimização do uso de recursos para reduzir o consumo de energia (ex: desligar instâncias ociosas).
Seleção de regiões AWS com menor pegada de carbono ou maior uso de energia renovável.
Uso de serviços gerenciados e sem servidor para otimizar a eficiência energética.
Otimização de código e algoritmos para reduzir o consumo de computação.
Medição e monitoramento do impacto ambiental das cargas de trabalho.
Principais pontos:
Entender o impacto: Medir o impacto ambiental das cargas de trabalho.
Estabelecer metas: Definir metas de sustentabilidade e monitorar o progresso.
Maximizar a utilização: Otimizar o uso de recursos para reduzir o desperdício.
Adotar arquiteturas eficientes: Usar serviços e padrões que minimizam o consumo de energia.
Reduzir o impacto de dados: Gerenciar o ciclo de vida dos dados para reduzir o armazenamento desnecessário.
Aproveitar as inovações da AWS: Utilizar os esforços de sustentabilidade da AWS (energia renovável, eficiência de data centers).
Comparativo com sustentabilidade on-premises:
Sustentabilidade na Nuvem (AWS): A AWS investe em data centers eficientes em termos de energia e em energia renovável, o que pode levar a uma pegada de carbono menor para as cargas de trabalho na nuvem em comparação com data centers on-premises. A elasticidade da nuvem permite que os recursos sejam escalados para cima e para baixo conforme a demanda, evitando o superprovisionamento e o desperdício de energia.
Sustentabilidade On-premises: Exige que as organizações invistam em suas próprias iniciativas de eficiência energética e energia renovável, o que pode ser caro e complexo. A capacidade de otimizar o uso de recursos é limitada pela infraestrutura física.