Post on 15-Jan-2016
description
2015/12015/1 Seção 3Seção 3 11
Estatística IEstatística I
Prof. Rafael GoldszmidtProf. Felipe Buchbinder
2015/12015/1 Seção 3Seção 3 22
Nós já vimos que…Nós já vimos que…
Introdução às variáveis aleatórias
2015/12015/1 Seção 3Seção 3 33
Existem dois tipos de problema…Existem dois tipos de problema…
Aqueles que podemos responder com certeza
─ Se uma conta de R$100 é dividida igualmente entre 5 pessoas, quanto cada pessoa vai pagar?
Aqueles que só podemos ter uma ideia da resposta
─ Cinco pessoas vão a um restaurante. Quanto tempo eles vão demorar para serem atendidos?
2015/12015/1 Seção 3Seção 3 44
Probabilidades servem para…Probabilidades servem para…
… dar boas respostas a problemas que não possuem respostas exatas.
• Qual vai ser a demanda pelo meu produto no próximo ano?
… responder problemas de respostas exatas caras ou impraticáveis.
• Qual é a altura média da população brasileira?
2015/12015/1 Seção 3Seção 3 55
─ Quantas peças vamos vender esse mês?─ Quantas pessoas estarão na fila no horário de pico?─ Quantos dos meus clientes vão honrar suas dívidas?─ Quanto custará o dólar daqui a um ano?─ Quanto tempo vai demorar até o fornecedor entregar a encomenda
que fizemos hoje?─ Quantos produtos ruins vão escapar do nosso controle de
qualidade?
PerguntaPergunta
Pense em algumas coisas que são importantes para um administrador mas que ele não sabe com certeza.
Algumas respostas, dentre várias possíveis…
2015/12015/1 Seção 3Seção 3 66
Quantas pessoas estarão na fila no horário de pico?─ Pode ser que não haja ninguém─ Pode ser que haja 1 pessoa─ Pode ser que haja 2 pessoas─ Pode ser que haja 3 pessoas─ e assim por diante
EventosEventos
Eventos
2015/12015/1 Seção 3Seção 3 77
Variáveis aleatóriasVariáveis aleatórias
Uma forma de representar eventos é usando uma letra maiúscula do início do nosso alfabeto:
• A: não ter ninguém na fila
• B: ter 1 pessoa na fila
• C: ter 2 pessoas na fila
• D: ter 3 pessoas na fila
… outra forma de representar os mesmos eventos é esta:
X = 0
X = 1
X = 2
X = 3
Em que X é uma variável que representa o número de pessoas na fila.
2015/12015/1 Seção 3Seção 3 88
─ X = 0─ X = 1─ X = 2─ X = 3─ X>0─ X<10─ 5<X<10
─ A─ B─ C─ D─ E─ F─ G
Qual forma de representar diz mais sobre o evento?Qual forma de representar diz mais sobre o evento?
Usando letras Usando variáveis aleatórias
2015/12015/1 Seção 3Seção 3 99
Como identificar a variável aleatória de interesseComo identificar a variável aleatória de interesse
Quantas peças vamos vender esse mês?
Quantas pessoas estarão na fila no horário de pico?
Quantos dos meus clientes vão honrar suas dívidas?
─ Quanto vai custar o dólar daqui a um ano?
─ Quanto tempo vai demorar até o fornecedor entregar a encomenda que fizemos hoje?
─ Quantas produtos ruins vão escapar do nosso controle de qualidade?
2015/12015/1 Seção 3Seção 3 1010
Compare as seguintes variáveis aleatórias:─ X = número de pessoas na fila no horário de pico.─ Y = volume de água necessário para esfriar uma determinada
máquina industrial.
Tipos de variáveis aleatóriasTipos de variáveis aleatórias
Na variável X, podemos determinar dois valores entre os quais nenhum outro valor é possível (1 e 2, por exemplo. Nenhum valor entre os dois é possível).Na variável Y, não se pode fazer isso. Quaisquer dois valores da variável Y sempre terá um valor possível no meio.Percebe-se, portanto, que as variáveis X e Y são de tipos diferentes.
2015/12015/1 Seção 3Seção 3 1111
Tipos de variáveis aleatóriasTipos de variáveis aleatórias
Quando for possível determinar dois valores possíveis de uma
variável aleatória entre os quais nenhum outro valor é possível,
dizemos que a variável aleatória é discreta.
Quando, entre quaisquer dois valores, sempre existir um outro
valor possível entre os dois, dizemos que a variável aleatória é
contínua.
2015/12015/1 Seção 3Seção 3 1212
Dependendo da escolha da variável aleatória, um mesmo
problema pode usar variáveis discretas ou contínuas:
─ Número de pedidos em atraso ou fração de pedidos atrasados.
Tipos de variáveis aleatóriasTipos de variáveis aleatórias
2015/12015/1 Seção 3Seção 3 1313
─ A: não ter ninguém na fila (X=0)─ B: ter 1 pessoa na fila (X=1)─ C: ter 2 pessoas na fila (X=2)─ D: ter 3 pessoas na fila (X=3)
Função de probabilidadeFunção de probabilidade
X = número de pessoas na fila no horário de pico
P(X = 0)
P(X = 1)
P(X = 2)
P(X = 3)
2015/12015/1 Seção 3Seção 3 1414
Número de pessoas na fila
Probabilidade
0 0,1
1 0,1
2 0,2
3 0,4
4 0,1
5 0,05
mais 0,05
Função de probabilidadeFunção de probabilidade
─ Exemplo de uma função de probabilidade
2015/12015/1 Seção 3Seção 3 1515
Qual é a probabilidade de alguém viver 80 anos?
Função densidade de probabilidadeFunção densidade de probabilidade
Para uma variável aleatória discreta, nós podemos especificar a probabilidade de X ser igual a um certo
valor.Para uma variável aleatória contínua, só podemos especificar a probabilidade de X estar entre dois
valores.
2015/12015/1 Seção 3Seção 3 1616
Função densidade de probabilidadeFunção densidade de probabilidade
2015/12015/1 Seção 3Seção 3 1717
Função densidade de probabilidadeFunção densidade de probabilidade
2015/12015/1 Seção 3Seção 3 1818
Função densidade de probabilidadeFunção densidade de probabilidade
2015/12015/1 Seção 3Seção 3 1919
.
Probabilidade de alguém viver acima dos 80 pode ser calculada pela área a partir deste ponto.
Função densidade de probabilidadeFunção densidade de probabilidade
2015/12015/1 Seção 3Seção 3 2020
─ A função de probabilidade é p(x) onde:
Função de probabilidade e função densidade de probabilidadeFunção de probabilidade e função densidade de probabilidade
Variável aleatória discreta Variável aleatória contínua
─ A função densidade de probabilidade é f(x) onde:
Para uma variável aleatória discreta, a função de probabilidade nos dá a probabilidade da variável aleatória ser igual a um determinado valor.
Para uma variável aleatória contínua, a área em um intervalo da função nos dá a probabilidade da variável aleatória estar naquele intervalo.
)()( xXPxp b
adxxfbXaP )()(
2015/12015/1 Seção 3Seção 3 2121
As questões anteriores nos levam a concluir que existem duas condições que
uma função densidade de probabilidade deve satisfazer:
(1)sempre ser maior ou igual a zero;
(2)somar (ou integrar) 1.
Variável aleatória discreta
Função de probabilidade e função densidade de probabilidadeFunção de probabilidade e função densidade de probabilidade
Variável aleatória contínua
iixp
xp
1)(
0)(
1)(
0)(
dxxf
xf
Dizendo a mesma coisa em símbolos matemáticos…
2015/12015/1 Seção 3Seção 3 2222
Regra prática muito útilRegra prática muito útil
Tudo o que é uma soma nas variáveis aleatórias discretas se torna uma integral nas variáveis aleatórias contínuas e vice-versa.
Em outras palavras, basta trocar a soma por uma integral ou vice-versa.
Variável aleatória discreta Variável aleatória contínua
iixp
xp
1)(
0)(
1)(
0)(
dxxf
xf
2015/12015/1 Seção 3Seção 3 2323
Função de distribuição acumuladaFunção de distribuição acumulada
)()( xXPxF
Número de pessoas na fila
Probabilidade Função de distribuição acumulada (fd)
0 0,1 0,1
1 0,1 0,2
2 0,2 0,4
3 0,4 0,8
4 0,1 0,9
5 0,05 0,95
mais 0,05 1
A função de distribuição acumulada é a função que dá a probabilidade de X ser
menor ou igual a um determinado valor.
F(x) é a soma (ou a integral) da fdp para todos os valores
menores que x.
2015/12015/1 Seção 3Seção 3 2424
F(80) é a área abaixo do limite de 80 anos
F(50) é a área abaixo do limite de 50 anos
A probabilidade de alguém viver entre 50 e 80 anos é a área entre os dois limites e é igual a :
F(80) – F(50)
Função de distribuição acumuladaFunção de distribuição acumulada
2015/12015/1 Seção 3Seção 3 2525
Se quisermos, por exemplo, calcular a probabilidade de haver entre 1 e 5 pessoas na fila, podemos fazer isso de duas formas:
Com a função de distribuição acumulada:0,95 – 0,1 = 0,85
Sem a função de distribuição acumulada:0,1+0,2+0,4+0,1+0,05 =0,85
Qual é mais simples?
Função de distribuição acumuladaFunção de distribuição acumulada
Número de pessoas na fila
Probabilidade (funçao de probabilidade)
Função de distribuição acumulada (fd)
0 0,1 0,1
1 0,1 0,2
2 0,2 0,4
3 0,4 0,8
4 0,1 0,9
5 0,05 0,95
mais 0,05 1
2015/12015/1 Seção 3Seção 3 2626
(1) A função densidade de probabilidade nunca decresce; (2)A função densidade de probabilidade sempre parte de 0 e
chega a 1.
Função de distribuição acumuladaFunção de distribuição acumulada
2015/12015/1 Seção 3Seção 3 2727
Eventos podem ser representados usando variáveis aleatórias.
Variáveis aleatórias podem ser discretas ou contínuas.─ Quando existirem dois valores entre os quais a variável, não pode
assumir nenhum valor, a variável é discreta.─ Quando, para quaisquer dois valores, sempre existir um valor no
meio que a variável puder assumir, a variável é contínua.
ResumindoResumindo
2015/12015/1 Seção 3Seção 3 2828
A função de probabilidade, associada a variáveis aleatórias discretas, nos permite calcular a probabilidade dos eventos acontecerem.
A função densidade de probabilidade, associada a variáveis aleatórias contínuas, nos permite calcular a probabilidade desta variável assumir um valor entre dois valores quaisquer. Esta probabilidade é a área sob a função neste intervalo.
A função de distribuição acumulada é a função F(x) que dá a probabilidade da variável aleatória ser menor ou igual a x. A probabilidade de X estar em um intervalo [a,b] é igual a F(b) – F(a).
ResumindoResumindo
2015/12015/1 Seção 3Seção 3 2929
Você trabalha para uma grande empresa multinacional. Um dia, em uma reunião com a diretoria, o CEO da empresa pergunta qual é a previsão de vendas no próximo ano. O que você responde?
MotivaçãoMotivação
A quantidade de peças que serão vendidas no próximo
ano é uma variável aleatória discreta cuja função de
probabilidade é dada por…
Nós esperamos vender cerca de 1000 peças, com 900 em um cenário pessimista e 1100 em
um cenário otimista
iixp
xp
1)(
0)(
2015/12015/1 Seção 3Seção 3 3030
MotivaçãoMotivação
Podemos querer tentar advinhar o valor que a variável aleatória irá assumir. Neste caso, usamos uma medida de
posição.
Podemos estar interessado em quanto a variável aleatória pode variar e, portanto, em qual é a incerteza que temos
ao estimar um valor para ela. Neste caso, usamos uma medida de dispersão.
2015/12015/1 Seção 3Seção 3 3131
Você se lembra da pergunta do CEO?
Medidas de posiçãoMedidas de posição
Qual é a previsão de vendas no próximo ano?
2015/12015/1 Seção 3Seção 3 3232
Existem várias medidas de posição possível:─ Moda: “o mais provável é que as vendas sejam de x unidades”.─ Mínimo: “vamos vender no mínimo x unidades”.─ Máximo: “nós não conseguiremos vender mais do que x unidades”.─ Mediana: “é igualmente provável vendermos mais ou menos do que
x unidades”.─ Valor esperado (semelhante à média).
Quais são os pontos fortes e fracos de cada medida de posição?
Medidas de posiçãoMedidas de posição
2015/12015/1 Seção 3Seção 3 3333
Valor esperadoValor esperado
Para dar respostas precisas a problemas probabilísticos, precisamos de uma medida que dê mais ênfase aos valores mais
prováveis da variável aleatória e menos ênfase aos valores menos prováveis.
Dentre as medidas de posição que vimos, a única que faz essa ponderação é o valor esperado.
)()( xpxXE
E, no caso de variáveis aleatórias contínuas, basta trocar a soma por uma integral:
dxxfxXE )()(
Lembrando que a soma (e a integral) se fazem sobre todos os valores possíveis de X.
2015/12015/1 Seção 3Seção 3 3434
Número de pessoas na fila
Probabilidade x . p(x)
0 0,1 0
1 0,1 0,1
2 0,2 0,4
3 0,4 1,2
4 0,1 0,4
5 0,1 0,5
Valor esperadoValor esperado
)()( xpxXE
Evento mais provável ganha mais peso
Evento menos provável ganha menos peso
E(X) = 2,6
O que significa que o número esperado de pessoas na fila é 2,6?Significa que observando o número de pessoas na fila durante vários dias teremos, em média, 2,6 pessoas.
2015/12015/1 Seção 3Seção 3 3535
Você tem uma ação da empresa X e uma ação da empresa Y. O retorno que você espera obter da ação da empresa X é 1,5%, ao passo que o dá empresa Y é 2%. Qual é o retorno total que você espera obter das duas ações? ─ Se você tivesse apenas duas ações da empresa X, quanto você
esperaria de retorno?─ E se você tivesse três ações?─ E quatro?
Se você tivesse uma ação da empresa X e uma aplicação em renda fixa que pagasse 0,5%. Qual seria o retorno esperado?
Propriedades do valor esperadoPropriedades do valor esperado
2015/12015/1 Seção 3Seção 3 3636
Você tem uma ação da empresa X e uma ação da empresa Y. O retorno que você espera obter da ação da empresa X é 1,5%, ao passo que o dá empresa Y é 2%. Qual é o retorno total que você espera obter das duas ações? E(X+Y) = E(X) + E(Y)─ Se você tivesse apenas duas ações da empresa X, quanto você
esperaria de retorno? E(c.X) = c.E(X)─ E se você tivesse três ações?─ E quatro?
Se você tivesse uma ação da empresa X e uma aplicação em renda fixa que pagasse 0,5%, qual seria o retorno esperado? E(X+c) = E(X) + c
Propriedades do valor esperadoPropriedades do valor esperado
2015/12015/1 Seção 3Seção 3 3737
E(X+Y) = E(X) + E(Y)─ E(c.X) = c.E(X), onde c é uma constante.
─ E(X+c) = E(X) + c , onde c é uma constante.
─ E(X.Y) = E(X).E(Y) se, e somente se, X e Y forem independentes.
Propriedades do valor esperadoPropriedades do valor esperado
2015/12015/1 Seção 3Seção 3 3838
Às vezes queremos saber quanto a variável aleatória pode variar
Medidas de dispersãoMedidas de dispersão
Nossas vendas mudam muito de mês para mês ou são estáveis ao longo do ano?
2015/12015/1 Seção 3Seção 3 3939
})]({[)( 2XEXEXVar
VariânciaVariância
A variância é o valor esperado do quadrado de quanto uma variável aleatória se afasta de seu valor esperado.
Variâncias pequenas significam que os valores das variáveis aleatórias são próximas do seu valor esperado e, portanto, a dispersão é pequena.
Variâncias grandes, por sua vez, indicam que as variáveis aleatórias podem se afastar bastante do seu valor esperado e, portanto, a dispersão é grande.
Para uma variável aleatória discreta, isto significa:
2( ) ( )[ ( )]Var X p X X E X
2015/12015/1 Seção 3Seção 3 4040
22 )]([)()( XEXEXVar
VariânciaVariância
A variância também pode ser escrita da seguinte maneira, menos intuitiva mas mais fácil de calcular:
Para mostrar isso, basta usar propriedades de valor esperado:
22
22
22
22
2
)]([)()(
)]([)()(2)()(
})]({[)](2[)()(
})]([)(2{)(
})]({[)(
XEXEXVar
XEXEXEXEXVar
XEEXXEEXEXVar
XEXXEXEXVar
XEXEXVar
2015/12015/1 Seção 3Seção 3 4141
A tabela a seguir contém a distribuição de probabilidades para a quantidade de acidentes de trânsito diários em uma pequena cidade:
─ Calcule o valor esperado da quantidade de acidentes de trânsito por dia─ Calcule a variância
ExercícioExercício
Quantidade de acidentes (X) P(X)
0 0,10
1 0,20
2 0,45
3 0,15
4 0,05
5 0,05
2015/12015/1 Seção 3Seção 3 4242
─ Somar uma constante a X faz ela variar mais?
─ Se dobrarmos X, o que acontecerá com a variância?
Propriedades da variânciaPropriedades da variância
})]({[)( 2XEXEXV
2015/12015/1 Seção 3Seção 3 4343
─ Somar uma constante a X faz ela variar mais? V(X+c)=V(X)
─ Dobrar X faz dobrar a distância X – E(X). Mas esta distância está elevada ao quadrado na definição de variância. Assim, se dobrarmos X, o que acontecerá com a variância? V(c . X)=c2 . V(X)
Propriedades da variânciaPropriedades da variância
})]({[)( 2XEXEXV
2015/12015/1 Seção 3Seção 3 4444
─ V(c . X) = c2 . V(X), onde c é uma constante.
─ V(X + c) = V(X), onde c é uma constante.
─ V(X + Y) = V(X) + V(Y) se, e somente se, X e Y forem independentes.
Propriedades da variânciaPropriedades da variância
2015/12015/1 Seção 3Seção 3 4545
Compare as propriedades de valor esperado e variânciaCompare as propriedades de valor esperado e variância
Valor esperado
• E(X+Y) = E(X) + E(Y)
• E(c.X) = c.E(X), onde c é uma constante.
• E(X+c) = E(X) + c , onde c é uma constente.
• E(X.Y) = E(X).E(Y) se, e somente se, X e Y forem independentes.
Variância
• V(c . X) = c2 . V(X), onde c é uma constante.
• V(X + c) = V(X), onde c é uma constante.
• V(X + Y) = V(X) + V(Y) se, e somente se, X e Y forem independentes.
2015/12015/1 Seção 3Seção 3 4646
─ Uma loja vende computadores e prevê sua demanda usando a variável aleatória
X = número de computadores vendidos por mês
─ Se X é medido em computadores, qual é a unidade de V(X)?
Um problema na variânciaUm problema na variância
})]({[)( 2XEXEXV
2015/12015/1 Seção 3Seção 3 4747
Desvio padrãoDesvio padrão
Desvio padrão é a raiz quadrada da variância e é também uma medida de dispersão.
O desvio padrão é mais fácil de interpretar, mas não tem propriedades matemáticas simples como a variância. Por isso, costuma-se fazer todas as contas com a variância e, no final, tirar a raiz quadrada para interpretar o
desvio padrão.
2015/12015/1 Seção 3Seção 3 4848
O gerente de uma grande rede de computadores desenvolveu a seguinte distribuição de probabilidades para a quantidade de interrupções por dia:
• Calcule o número esperado de interrupções por dia.• Calcule a variância.• Calcule o desvio padrão.
ExercícioExercício
Interrupções (X) P(X)
0 0,32
1 0,35
2 0,18
3 0,08
4 0,04
5 0,02
6 0,01
2015/12015/1 Seção 3Seção 3 4949BibliografiaBibliografia
Básica─ Levine et al.
Capítulos 5 (exceto 5.2.) e 6.
─ Bussab e MoretinCapítulo 6 (exceto 6.6.1, 6.6.4 e 6.8) e 7 (exceto 7.4.1, 7.5, 7.6, 7.7 e 7.8).