Post on 22-Jan-2018
Falando de TCO na nuvem da AWS
Claudio Chiba
IT Transformation Senior Consultant
AWS Professional Services
Abril, 2017
O que esperar desta sessão
• Visão geral de TCO – Total Cost of Ownership
• Otimização de Custos
• Metodologia de Migração
Total Cost of OrangesAo analisar TCO, certifique-se que todos os fatores sejam
considerados
• Place – Instalações Prediais e Segurança Física
• Power – Energia Elétrica e Geradores
• Pipes – Refrigeração e Redes
• Patterns – Padrões de Arquitetura
• People – Equipe de Operações e Melhoria Contínua
Menor TCO com AWS
Fonte: IDC Whitepaper, patrocinado
pela Amazon, “The Business Value of
Amazon Web Services” Maio 2015
1
Substituição de CAPEX por OPEX
2
59 Reduções de
Preço desde
2006
Economias de escalapermitem redução de
preços pela AWS
4
Economize ao crescer
Tiered Pricing
Descontos por Volume
Preço Customizado
3
Modelo de preços com suporte para workloads
estáveis e variáveis
On-Demand
Reserved
Spot
Dedicated
https://aws.amazon.com/resources/analyst-reports/IDC-business-value-aws/
Modelos de Preços para Vários Cenários
On-Demand
Pague por capacidade de processmento por hora sem
compromisso de longoprazo
Para cenários com picos de uso ou para definir
necessidades
Reserved
Faça uma reservaantecipada através de
pagamento antecipado e receba até 75% de
desconto
Para utilização estável e previsível
Spot
Faça um lance por capacidadenão utilizada, cobrança por
preço que flutua baseado emoferta e demanda
Para processamento intensivoe transiente
Dedicated
Lance instâncias emhardware dedicado a um
único cliente
Para cenários sensíveis a compliance e licenciamento
59 reduções de preço anunciadas pela AWS desde 2006
Amazon
ElastiCache
reduz preços
de cache
nodes em
média de 34%
Março 2014
34%Amazon S3 reduz
preços para
Standard
e Reduced
Redundancy
Storage em média
de 51%
Março 2014
51%Amazon Route 53
reduz preços para
standard queries e
latency-based
routing queries
em 20%
Julho 2014
20%
8
Amazon EC2 reduz
preços para
instâncias C4 em
10% desde seu
lançamento em
Janeiro de 2015
Jan 2016
10%
TCO = Custos de Aquisicão + Custos de Operação
Networkcosts
Storagecosts
Servercosts
Hardware – server, rack chassis PDUs, ToR switches
(+maintenance)
Software - OS, virtualization licenses
(maintenance)
Overhead cost
Space Power Cooling
Hardware – storage disks, SAN/FC switches
Overhead cost
Storage admin costs
Network hardware – LAN switches, load balancer
bandwidth costsNetwork admin costs
Overhead cost
IT laborcosts
Server adminVirtualization admin
1
2
3
4
Space Power Cooling
Space Power Cooling
Exemplo de Custos de Servidores
Rack Chassis$3,500/Rack
PDU$1,080/PDU
ToR Switch$4,800/Switch
MúltiplosServidores
Processors Cores Price Power (W) Size (U)
1
1 $ 1,163
300 1
2 $ 1,661 4 $ 1,910 6 $ 2,159 8 $ 2,408
10 $ 2,657 12 $ 2,907
2
1 $ 3,584
550 2
2 $ 5,120 4 $ 5,888 6 $ 6,656 8 $ 7,424
10 $ 8,192 12 $ 8,960
4
1 $ 8,386
750 4
2 $ 11,980 4 $ 13,777 6 $ 15,574 8 $ 17,371
10 $ 19,168 12 $ 20,965
8
1 $ 20,825
1200 8
2 $ 29,742 4 $ 34,201 6 $ 38,660 8 $ 43,118
10 $ 47,577 12 $ 52,054
Custos de Hardware para um Rack Padrão
Typical Server hardware prices based on processors and cores (doesn’t include Software licenses)
Provisionamento de Spare Servers - 5%Manutenção de Hardware – 15%/Ano
Custos Software
Windows Server OS$4,810/2 processors
VMware vSphere Ent+$3,495/processor
Software Maintenance25%/Year
Default Hardware Discount- 20%
Desconto
Default Software Discount- 20%
Espaço, Energia, Refrigeração
- $2000/rack/month- Rack padrão 42U
Custos de Facilities
AWS TCO Calculatorhttps://awstcocalculator.com/
https://aws.amazon.com/economics
Estudos de caso e pesquisa
Planejamento de capacidade tradicionalLimitações de data centers tradicionais
Ativos físicos inflexíveis Custos fora de sincronismo
Custos de expansão e migraçãosão altos
Custo inesperado de ineficiências
Infraestrutura elástica e paga por uso
Falta de
capacidade
Custos $
Tempo
CAPEX
Oportunidade
Demada estimada
Hardwaretradicional
Demandareal
Virtualizaçãoautomatizada
Otimização de Custos é…Sair de… Para…
Pagar pelo que você Usa Pagar pelo que você Precisa
Time
Usage
Page Views
Revenue
ECUs
Etc.
Costs
Time
Usage
Page Views
Revenue
ECUs
Etc.
Costs
Os Cinco Pilares de Otimização de Custos
Right Sizing Reserved Instances
Elasticidade GovernançaArquiteturaInteligente
Investimentocorreto
PrevisibilidadeCAPEX para OPEX
Relatórios & KPIs
Investimentointeligente
Arquitetura InteligenteServiços gerenciados (SQS, SNS, SES, ELB, …)
• Mudança de modelo de custo por hora de instância para custo de requisições
• Exemplo: Cloudfront pode habilitar custos menores de transferência de dados
Use a funcionalidade correta
• S3 Infrequent Access pode ser 40% mais barato que S3 Standard
• EBS General Purpose SSD (GP2) provisiona IOPS por padrão
Regra geral: analise os serviços AWS ao desenhar a arquitetura
Alivie sua arquitetura
+
Configuração Padrão
• 4 x Medium Instances
$201
• AWS Data Transfer 1 TB
$92
• Total = $293
Configuração otimizada
• 1 x Medium Instance
$50
• CloudFront Data 1 TB
$87
• CloudFront Requests (10M)
$7.5
• Total = $144.5
51%
6X
Mais barato
Mais rápido
Amazon CloudFront
Bucket S3
Elasticidade
Liga e Desliga Crescimento Rápido
Picos previsíveisPicos variáveis
Insatisfação do Cliente
Desperdício
Aumente a Elasticidade
Desligue instâncias de não-produção
• Procure por instâncias de dev/teste que estejamsempre ligadas e automatize o desligamento,gerando até 65% de redução de custo.
Autoscale em Produção
• Use Autoscaling para ligar e desligar instâncias com base em demanda (CPU, requisições…) e hora do dia/semana
Regra geral: Tente desligar aproximadamente 30% de suas instâncias diariamente *
* 65% das horas de um mês correspondem a noites e finais de semana
Right Sizing
Right Sizing
• Selecione a instância com menor preço que atenda aosrequisitos de desempenho
• Analise utilização de CPU, RAM, storage e rede para identificar instâncias com potencial de redução ouaumente a instância para diminuir o tempo de processamento
• Alavanque as métricas de CloudWatch e configure métricas de RAM
Regra geral: Encontre o tamanho correto de instância e em seguida reserve capacidade.
Right Sizing - Exemplo
Instance ID Instance Type On-Demandcost pm
Instance Specs Utilization data from Cloudwatch
ABC-123 c3.xlarge $193.45 4 vCPU7.5GiB RAM80 SSD
Max vCPU: 35%Max Disk IO: 0Max NW: 302 Mbps
right-sizing para
Instance ID Instance Type
On-Demandcost pm
Instance Specs Savings
ABC-123 m4.large $129.94 2 vCPU8GiB RAMEBS only
33% savings
Combine Right Sizing e ElasticidadeMais instâncias menores vs. menos instâncias maiores
29 m3.large @ $0.133 OD$3.85 / hora*
59 t2.medium @ $0.052 OD$3.06 / hora *
*Assumindo instâncias Linux em Virginia
Instâncias Reservadas - RIs
Passo 1: Cobertura de RI
• Cubra recursos que estejam sempre ligados
Passo 2: Utilização de RI
• Alavanque a flexibilidade de RI para aumentar suautilização
Regra geral: Alvo de 70-80% de cobertura de recursossempre ligados e taxa de 95% de utilização.
Nível de comprometimento: 1 ou 3 anosOpções de pagamento: No Upfront, Partial Upfront e All UpfrontServiços AWS elegíveis: EC2, RDS, DynamoDB, Redshift e ElastiCache
Instâncias Reservadas - Exemplo
Singapore, Linux
$ per hour On-Demand 1Y PURI Savings
m4.large $0.178 $0.1062 -40.34%
c4.large $0.144 $0.0932 -35%
i2.xlarge $1.018 $0.5222 -49%
Assumindo utilização para uma m4.large:
Hours On-Demand Cost PURI Cost Savings
100% of the month 744 $132.43 $79.01 -40%
80% of the month 595 $105.95 $79.01 -25%
59.66% of the month 446 $79.06 $79.01 0%
40% of the month 298 $52.97 $79.01 49%
Mesmo com 80% de utilização, a RI aindaapresenta 25% de vantagem sobre on-demand
Elastic Compute Unit (ECU)
Desafio
Minimizar o custo unitário em
períodos de crescimento massivo
Uma medida consistente de capacidade de processamento
de CPU1 ECU: Poder computacional de uma CPU de 1.0-1.2 Ghz de um servidor de 2007
Companhia do Setor Financeiro
O que Abr‘14 Abr‘15 Δ
Pico de Consumo de CPU
1.601k ECU13.957k
ECU+772%
Custo de Instâncias $59k pm $244k pm +313%
$270k de economiapor mês!
Companhia do Setor Financeiro
Custo Unitário: Elastic Compute Unit Por Hora
60% Redução emCusto Unitário
Companhia do Setor Financeiro
Apr 1 2014 Apr 30 2014
1.000 a 1.100 ECUs provisionadasconsistentemente
Utilize Tag em seus recursos
• Key Name: Tag name
• exemplo: ”Centro de Custo”
• Value: Descrição da Tag
• exemple: centro de custo ”35667”
Sugestões de Tag : Ambiente, Responsável, Departmento…
Tenha em mente: menos é mais
Budget Alerts
• Budget: Crie alarmes de orçamento por serviço, tag, AZ e AWSID para acompanhar os custos AWS
• Dica: Habilite notificações por e-mail
Budget Alerts
• Quero ser notificado caso oscustos mensais de EC2 ultrapassem $100 durante o mês
• Se o forecast mensal estimarum valor mais alto que o planejado será enviado um alarme para os e-mails configurados
Cost Explorer
• Acompanhamento de custos de maneira visual, traz os últimos 13 meses de dados e pode estimar até 3 meses com base nos custos atuais
• Use Cost Explorer para identificar padrões e tendências de utilização. Dados podem ser agrupados por mês/dia e somados por serviço, AZ, tags, instance type e AWSID.
Exemplo de Dashboard
Quanto maispoderia ser
economizado com Ris?
Quanto estoueconomizando
atualmente com as Ris existentes?
Estou utilizandobem as Ris?
Estou usando nuvem comodeveria, desligando e Iigando
instâncias?
Estou alavancandoos modelos RI e
Spot?
Como foi a utilização de horas no último mês?
Visualização de (1) Elasticidade vs steady-state, e(2) cobertura de
RI/OD/Spot.
Alavancas de Otimização de Custos
Medir,
Monitorar,
Melhorar
Right
Sizing
Capacidade
Reservada
ElasticidadeCiclo contínuo de avaliação,
comparação e integração com Operações
100
50
25
12 8 6 4
0
25
50
75
100
125
Base Price Rightsized Seasonal Daily Scaling Reserved Tech Refresh Price Cuts
Exemplo de Optimização: Netflix
Elasticidade Tech Lifecycle
Adrian Cockcroft speech at AWS re:Invent 2014 | (ARC201) Cloud-Native Cost Optimization
Linha do tempo de custo de Nuvem
0
0.2
0.4
0.6
0.8
1
Aug-10
Oct-10
Dec-10
Feb-11
Apr-11
Jun-11
Aug-11
Oct-11
Dec-11
Feb-12
Apr-12
Jun-12
Aug-12
Oct-12
Dec-12
Feb-13
Apr-13
Jun-13
Aug-13
Oct-13
Dec-13
Feb-14
Apr-14
Jun-14
Aug-14
Oct-14
Dec-14
Feb-15
Apr-15
Jun-15
0
0.2
0.4
0.6
0.8
1
1.2
Aug-10
Oct-10
Dec-10
Feb-11
Apr-11
Jun-11
Aug-11
Oct-11
Dec-11
Feb-12
Apr-12
Jun-12
Aug-12
Oct-12
Dec-12
Feb-13
Apr-13
Jun-13
Aug-13
Oct-13
Dec-13
Feb-14
Apr-14
Jun-14
Aug-14
Oct-14
Dec-14
Feb-15
Apr-15
Jun-15
~Not 20x Growth
Dólares(normalizado)
Custo por Unidade(normalizado)
Cloud Economics
$
1 2 3 4 50
TCO
Custos de Migração
Otimização de Custos
Atual / Do Nothing
Ambiente AWS
Payback Period
Tempo
Custos
A Bolha de Migração – Componentes
Levantamento e planejamento
Ferramentas de Migração
Parceiros de Consultoria
Treinamento Interno Ambientes Duplicados Penalidades de Aluguel
Metodologia AWS de Migração
Strategy
• Assessment and Profiling
• Prioritization
• Data requirements and classification
• Business logic and Infrastructure dependencies
Design
• Detailed migration plan and effort
• Network topology
• Core infra services
• Security and risk assessment
• Prep on-preminfrastructure
Migrate
• Migrate
• Deploy
• Infrastructure integration
• Application integration
Transition
• Functional Validation
• Pilot testing
• Transition to support
• Release management
• Cutover and Decommission
Operations
• Staff Training
• Monitoring
• Incident management
• Provisioning
Improvement
• Monitoring-driven optimization
• Continuous Integration and Continuous Deployment
Plan RunMigrate
Application Migration AssessmentRe-hosting / Re-deploying
(Lift and Shift)
Re-architecting / Re-factoring(Rewrite and decouple)
Application Optimization
Padrões de Migração
Discover,
Assess (Enterprise
Architecture and
Applications)
Lift and Shift
(Minimal
Change)
Migration and
UAT Testing Operate
Refactor
for AWS
Application
Lift and Shift
Move the App
Infrastructure
Plan Migration
and Sequencing
Determine
Migration Path
Decommission
Do Not Move
Design, Build AWS
Environment
Move the
Application
Determine
Migration
ProcessManually Move
App and Data
3rd Party Tools
AWS VM ImportRefactor
for AWS
Rebuild Application
Architecture
Vendor
S/PaaS
(if available)
3rd Party Migration Tool
Manually Move App and Data
Determine
Migration Process
Replatform
(typically legacy
applications)
Recode App
Components
Rearchitect
Application
Recode
Application
Architect AWS Environment
and Deploy App, Migrate Data
Signoff
Tuning Cutover
Org/Ops
Impact
Analysis
Identify
Ops Changes
Change
Management
Plan
Níveis de esforço para MigraçãoVery Low
Basic workload
Current/supported OS on AWS
No database
Few dependencies
Scheduled outage is OK
Low
Basic workload
No database
May require re-platforming (i.e. OS)
Scheduled outage is OK
Medium
Contains multiple components
No database
May require re-platforming (i.e. OS change / upgrade)
Outage with advance planning
Business impact possible for production servers
High
Multiple components including database
System may include greater than five disks
Limited downtime permitted
Production servers likely to impact business if unavailable for an extended period of time
Very High
Multiple components including database
Complex system configuration (e.g. numerous disks)
Contains several dependencies
Limited to No acceptable downtime
Requires advanced detailed assessment and planning
High-touch migration
2 – 4 hours 4 – 6 hours 6 – 8 hours 10 – 14 hours 20 – 24 hours
VM Conversion
Host Cloning
VM Conversion
Host Cloning
Live Migration
App Containerization
Live Migration
App Containerization
Mig
rati
on
M
eth
od
Live Migration
App Containerization
Esforço total de 469 hosts
Exemplo de modelo de esforço de migração
• Modelo de custo baseado emempresa com 469 workloads de complexidades variadas.
• Média de esforço de migração: 5.66 hours per host
88
205
55
109
120
50
100
150
200
250
Very Low Low Medium High Very High
2 4 6 10 20
$1202 per server (avg)
$153
$849
$200
2656 hours @$150/hr avg
250 hours @$287.50 avg
Custo total de migração = $563,738
Custo médio de migração para cada servidor
Determinando o período de Payback da Bolha de Migração (i.e., Break-even)
On-prem (3 yr) AWS (3 yr)
Compute $1,720,061 $698,858
Storage $774,800 $245,353
Network $367,659 $37,104
IT Labor $675,360 $550,240
AWS Support $0 $98,131
Determinando o período de Payback da Bolha de Migração(i.e., Break-even)
On-prem (3 yr) AWS (3 yr)
Compute $1,720,061 $698,858
Storage $774,800 $245,353
Network $367,659 $37,104
IT Labor $675,360 $550,240
AWS Support $0 $98,131
Total $3,537,880 $1,629,686
$636,064 economia anual
Custo de migração One-time: $563,738 Break-even: 10.6 meses
Custo= uso x rate
Não opere em nuvem da mesmaforma que um data center tradicional Capacidade Reservada
Right SizingElasticidade*
* 65% das horas do mês são noites e fins-de-semana