Distribuição Binomial e Poisson

Post on 28-Oct-2015

147 views 1 download

Transcript of Distribuição Binomial e Poisson

Mais Aplicações sobre cálculo deprobabilidades

Prof. Hemílio Fernandes Campos Coêlho

Departamento de Estatística - Universidade Federal da Paraíba - UFPB

Noções de Epidemiologia

I Em algumas aplicações de saúde, a base do conhecimento é denatureza probabilística.

I Algumas aplicações envolvem o que chamamos em saúde deindicadores epidemiológicos

I Uma aplicação importante da teoria das probabilidades em saúdeestá relacionada à avaliação da capacidade que um determinadoexame tem de acertar o verdadeiro diagnóstico.

I Isto acontece devido à limitação que o pesquisador possui paraelaboração do exame.

I Ou seja, um diagnóstico é emitido de acordo com a capacidade deum exame clínico para detectar o evento de interesse.

I O quadro a seguir mostra de maneira esquemática os possíveisresultados associados à comparação do resultado de um exame queestá sendo avaliado e o resultado de�nitivo ou diagnóstico de�nitivoou diagnóstico de certeza.

continuação

Resultado de um exame diagnóstico versus diagnóstico de certeza

Diagnóstico de CertezaTotais

Doença(+) Doença(−)Resultado do Exame(+) a(++) b(+−) a+ b

Exame Exame(−) c(−+) d(−−) c + d

Totais a+ c b + d a+ b + c + d

Conceitos Iniciais

I Falso-Positivo: Indivíduo sadio cujo exame resultou positivo. Noquatro anterior, corresponde à letra b

Para determinar a probabilidade do evento �falso-positivo�, bastadividir b pelo total de exames positivos, a+ b.

I Falso-Negativo: Indivíduo doente cujo exame resultou negativo.No quatro anterior, corresponde à letra c

Para determinar a probabilidade do evento �falso-negativo�, bastadividir c pelo total de exames negativos, c + d .

continuação

I Sensibilidade: É a proporção de indíviduos cujo exame revelouresultado positivo e que possuem a doença, no grupo deindivíduos doentes. Ou seja:

Sensibilidade = S =a

a+ c

I A sensibilidade avalia o total de acertos do exame sobre overdadeiro número de doentes.

I Quanto mais próximo de 1 estiver o valor da sensibilidade do teste,melhor será esse teste.

Observação Importante: Ao fazer (1− S), o pesquisador estárespondendo a seguinte pergunta: �Qual a proporção de indivíduos

doentes que o exame deixou de diagnosticar como tais?� Essa proporçãoé a proporção de falso-negativos no total de pessoas doentes.

continuação

I Especi�cidade: É a proporção do número de indivíduos sadioscujo exame resultou negativo, no grupo de indivíduos sadios.Ou seja,

Especi�cidade = E =d

b + d

I A especi�cidade expressa o total de exames corretamente negativossobre o total de indivíduos sadios.

I Quanto mais próxima de 1 estiver a especi�cadade, melhor será esseteste.

Observação Importante: Ao fazer (1− E ), temos a proporção é aproporção de falso-positivos no total de pessoas doentes.

continuação

I Valor preditivo positivo: É a proporção de indivíduos doentes comexame positivo no grupo de exames positivos.

Valor Preditivo Positivo = VPD =a

a+ b

I Valor preditivo negativo: É a proporção de indivíduos sadios comexame negativo no grupo de exames negativos.

Valor Preditivo Negativo = VPN =d

c + d

continuação

I Acuidade ou E�ciência Global do Teste: Veri�ca o percentual deacerto do exame diagnóstico no grupo total de pacientes analisados.

Acuidade = A =a+ d

a+ b + c + d

I Prevalência: É a proporção de pacientes doentes no grupo total depacientes analisados.

Prevalência = P =a+ c

a+ b + c + d

Observações Importantes

I Cienti�camente já foi constatado que um teste com altaespeci�cidade deve ser usado quando a prevalência da doença érelativamente baixa (doença rara), mesmo que o teste tenharelativamente baixa sensibilidade.

I O mesmo pode ser dito em relação a um teste com altasensibilidade deve ser usado quando a prevalência da doença é alta(doença comum), mesmo que o teste tenha relativamente baixaespeci�cidade.

Coe�ciente de Kappa (κ)

I Coe�ciente utilizado quando se tem interesse em testar aconcordância entre dois diagnósticos diferentes, fornecidos porpesquisadores diferentes.

Concordância de diagnóstico entre dois pesquisadores

Diagnóstico 2Totais

(+) (−)Diagnóstico (+) a(++) b(+−) a+ b

1 (−) c(−+) d(−−) c + d

Totais a+ c b + d a+ b + c + d

A proporção da concordância observada é dada por

PCO =a+ d

a+ b + c + d

Além disso, precisamos da chamada concordância causal:

PCC =(a+ b)(a+ c) + (c + d)(b + d)

(a+ b + c + d)2

Coe�ciente de Kappa (κ)

Logo:

κ =PCO − PCC

1− PCC

Quando há total concordância, o coe�ciente é igual a 1. Quando hádiscordância total, o coe�ciente é igual a 0. Para avaliar o grau deconcordância, é possível avaliar a seguinte classi�cação:

κ = 0 −→ total discordância

0 < κ < 0, 4 −→ concordância leve

0, 4 ≤ κ < 0, 8 −→ concordância moderada

0, 8 ≤ κ < 1 −→ concordância forte

κ = 1 −→ concordância perfeita

Distribuições de Probabilidade

De�nição: De�nimos como uma variável aleatória X uma característicaque pode assumir valores de�nidos em um conjunto de n valores:

X = {x1, x2, . . . , xn}

A relação

xi −→ f (xi )

de�ne uma correspondência entre todos os valores que a variávelaleatória pode assumir, xi , e suas respectivas probabilidades deocorrência, f (xi ). Esta relação é o que chamamos em estatística defunção de probabilidade da variável aleatória X . Analogamente aoestuda da estatística descritiva, as variáveis aleatórias também podem serdivididas em dois tipos: discretas e contínuas.

Modelos Probabilísticos Discretos

Exemplo

I Suponha que o número máximo de leitos que uma unidade deterapia intensiva comporte seja 4. De�nindo a variável aleatória X

como �número de óbitos (na UTI)�, os valores que a variávelaleatória pode assumir, num certo período de tempo, são:

X = {0, 1, 2, 3, 4}

onde:

I X = 0 signi�ca nenhum óbito (quatro pacientes vivos);I X = 1 signi�ca um óbito (três pacientes vivos);I X = 2 signi�ca dois óbitos (dois pacientes vivos);I X = 3 signi�ca três óbitos (um pacientes vivos);I Por �m, X = 4 signi�ca quatro óbitos, nenhuma sobrevivência.

Exemplo

I Suponha que o número máximo de leitos que uma unidade deterapia intensiva comporte seja 4. De�nindo a variável aleatória X

como �número de óbitos (na UTI)�, os valores que a variávelaleatória pode assumir, num certo período de tempo, são:

X = {0, 1, 2, 3, 4}

onde:

I X = 0 signi�ca nenhum óbito (quatro pacientes vivos);I X = 1 signi�ca um óbito (três pacientes vivos);I X = 2 signi�ca dois óbitos (dois pacientes vivos);I X = 3 signi�ca três óbitos (um pacientes vivos);I Por �m, X = 4 signi�ca quatro óbitos, nenhuma sobrevivência.

Exemplo

I Supondo que as probabilidades associadas a cada um destespossíveis resultados sejam

f (0) = 0, 3164f (1) = 0, 4219f (2) = 0, 2109f (3) = 0, 0461f (4) = 0, 0039

É possível montar a função mostrada no quadro a seguir:

X 0 1 2 3 4 Somaf (x) 0,3164 0,4219 0,2109 0,0461 0,0039 1

que é função de probabilidade do número de óbitos.

continuação

I Note que para n possíveis valores da variável aleatória X temos que

n∑i=1

f (xi ) = 1

Em nosso exemplo, n = 4. Note que esse resultado é algo jáesperado, pois estamos avaliando todas as possibilidades deocorrência da variável aleatória X .

Construção da função de probabilidade

I Suponha que a probabilidade de óbito de um paciente, ao darentrada na UTI, seja de 25% (risco de morte).

I De�nindo a variável aleatória X como no exemplo anterior, tem-se

X = { 0 , 1 }{

f (0) = 0, 75f (1) = 0, 25

I Ou seja,

X 0 1 Somaf (x) 0,75 0,25 1

Construção da função de probabilidade

I Se dois pacientes ingressarem na UTI (n = 2),

I Sendo p(vi ) é a probabilidade do paciente i sobreviver e p(oi ) é aprobabilidade do paciente i morrer, tem-se

X = { 0 , 1 , 2 }

f (0) → p(v1)p(v2) = 0, 75 · 0, 75 = 0, 5625

f (1) →{

p(v1)p(o2) = 0, 75 · 0, 25 = 0, 1875p(o1)p(v2) = 0, 25 · 0, 75 = 0, 1875

⇒ 0, 3750

f (2) → p(o1)p(o2) = 0, 25 · 0, 25 = 0, 0625

I O quadro com as funções de probabilidade é dado a seguir:

X 0 1 2 Somaf (x) 0,5625 0,3750 0,0625 1

Observações Importantes:

I A construção para um número maior de casos (n) pode serrealizado.

I Porém, é uma tarefa repetitiva e bastante trabalhosa.

I De modo a sistematizar o cálculo de probabilidades de umdeterminado número de ocorrências em n casos, considera-se aDistribuição Binomial.

Distribuição Binomial

I Considere uma variável aleatória de�nida em termos binários, ouseja, com dois valores possíveis de ocorrer em n experimentos, ou n

ensaios, ou n tentativas, n casos, etc.

I Denotando a probabilidade de ocorrência(ou sucesso) de X por p ea probabilidade de não-ocorrência de X por q, tem-se p + q = 1.Note que q = 1− p.

I Com base nessa informação, a probabilidade de x ocorrências davariável aleatória X em n casos é dada por:

P(X = x) =

(n

x

)pxqn−x

continuação

I Através de uma distribuição de probabilidade é possível calcularvalores para o que chamamos em estatística de parâmetro, ou seja,um valor conceitualmente conhecido na população com base nosvalores da amostra. Dessa forma, para o modelo binomial:

B Média = Valor Esperado = E [X ] = µ = n · p

B Variância = σ2 = n · p · q

B Desvio Padrão = σ =√n · p · q

I Note que o formato da distribuição binomial depende de p e de nexclusivamente.

EXEMPLO

Suponha que a probabilidade de um indivíduo do sexo masculino(M),com mais de 60 anos, sedentário(S) e fumante(F), desenvolver umadoença cardiovascular nos próximos 8 anos seja de 40%. A partir de umestudo controle com 10 indivíduos com essas características, qual aprobabilidade de que nenhum desses indivíduos sofra doençascardiovasculares no período determinado?

EXEMPLO

Suponha que a probabilidade de um indivíduo do sexo masculino(M),com mais de 60 anos, sedentário(S) e fumante(F), desenvolver umadoença cardiovascular (DCV) nos próximos 8 anos seja de 40%. A partirde um estudo controle com 10 indivíduos com essas características, quala probabilidade de que nenhum desses indivíduos sofra doençascardiovasculares no período determinado?Resposta: Note que n = 10. Além disso,

P(DCV |M ∩ (60+) ∩ S ∩ F ) = P(X ) = p = 0, 4

Logo, a probabilidade de nenhum caso de DCV resulta em

P(X = 0) =

(100

)(0, 4)0(0, 6)10 = 0, 0060 = 0, 60%

continuação

Qual a probabilidade de menos de três indivíduos da amostra terem DCV?

P(X < 3) = P(X = {0, 1, 2}) = P(X = 0) + P(X = 1) + P(X = 2)

P(X = 0) =

(100

)(0, 4)0(0, 6)10 = 0, 0060 = 0, 60%

P(X = 1) =

(101

)(0, 4)1(0, 6)9 = 0, 0403 = 4, 03%

P(X = 2) =

(102

)(0, 4)2(0, 6)8 = 0, 1209 = 12, 09%

P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)= 0, 0060+ 0, 0403+ 0, 1209 = 0, 1672 = 16, 72%

continuação

Qual a probabilidade de pelo menos três indivíduos da amostra teremDCV?

P(X ≥ 3) = P(X = {3, 4, 5, 6, 7, 8, 9, 10})= P(X = 3) + P(X = 4) + · · ·+ P(X = 10)

Contudo, como sabemos quen∑i=1

f (xi ) = 1, podemos utilizar este

resultado para simpli�car os cálculos. Ou seja:

P(X ≥ 3) = 1− P(X < 3) = 1− 0, 1672 = 0, 8328

continuação

Qual é a média (ou valor esperado) de casos de DCV?

µ = 10 · 0, 4 = 4 casos

Qual é o desvio padrão do número de casos de DCV?

σ =√10 · 0, 4 · 0, 6 = 1, 55 ≈ 2casos.

Distribuição de Poisson

I A distribuição de Poisson está associada com a taxa de ocorrênciado número de casos da variável aleatória X .

I A função de probabilidade de Poisson é dada por

P (X = x) =

(e−λ

)λx

x!, lembrando que e = 2, 71828...

I A partir deste tipo de distribuição também é possível obter valoresde média, variância e desvio padrão:

B µ = λ

B Variância = σ2 = λ

B Desvio Padrão = σ =√λ

continuação

I Ao substituir λ por µ = np, note que a função de probabilidade dePoisson é dada por

P (X = x) =(e−µ)µx

x!=

(e−(np)

)(np)x

x!

I Esta expressão dá uma aproximação da distribuição binomial, tantomais precisa quanto menor for o valor de p.

I Em áreas de saúde, essa modelagem probabilística é utilizada emsituações de estudos relacionados à patologias raras (valor de pbaixo).

EXEMPLO

Suponha que uma em cada mil pessoas que utilizam determinadoanestésico sofra uma reação negativa. Num total de 500 cirurgias em quese empregou esse anestésico, qual é a probabilidade de que 1 pessoa sofraa reação?Resposta: Primeiramente,

λ = µ = n · p = 500 · 0, 001 = 0, 5

Logo,

P(X = 1) =e−0,50, 51

1!= 0, 3033 = 30, 33%

continuação

Qual é a probabilidade de nenhum paciente sofrer reação?Resposta:

P(X = 0) =e−0,50, 50

0!= 0, 6065 = 60, 65%

Qual é a probabilidade de mais de um paciente sofrer reação?Resposta:

P(X > 1) = 1− P (X = {0 , 1}) = 1− [P(X = 0) + P(X = 1)]

P(X > 1) = 1− (0, 6065+ 0, 3033) = 0, 0902 = 9, 02%

Modelos Probabilísticos Contínuos

Modelos contínuos de probabilidade

Variável Aleatória Contínua:

I Assume valores num intervalo de números reais.

I Não é possível listar, individualmente, todos os possíveis valores deuma variável aleatória contínua.

I Dessa forma, associamos probabilidades a intervalos de valores davariável.

I Ou seja, a probabilidade será calculada como uma área de interesseno grá�co da distribuição.

Distribuição Normal

I Observemos por exemplo, o peso em Kg, de 1500 pessoas adultasselecionadas ao acaso em uma população.

I O histograma do conjunto de dados é dado a seguir:

Distribuição Normal

A análise do histograma mostra que:

I a distribuição dos valores é aproximadamente simétrica em torno de70kg;

I a maioria dos valores (88%) encontra-se no intervalo (55;85);

I existe uma pequena proporção de valores abaixo de 48kg (1,2%) eacima de 92kg (1%).

Distribuição Normal

I De�nindo a variável aleatória X : peso, em kg, de uma pessoaadulta escolhida ao acaso da população.

I É natural então considerar a distribuição dos valores da variávelaleatória X , isto é, qual a distribuição de probabilidades de X?

I A curva contínua nesse grá�co se chama curva Normal.

Distribuição Normal

A distribuição normal é uma das mais importantes distribuiçõescontínuas de probabilidade, pois:

I Muitos fenômenos aleatórios comportam-se de forma próxima a essadistribuição.

Exemplos:

1. Altura;2. Pressão sanguínea;3. Peso.

I Pode ser utilizada para calcular, de forma aproximada,probabilidades para outras distribuições, como por exemplo, para adistribuição Binomial.

Observação Importante

I Nem todos os fenômenos se ajustam à distribuição Normal.

Exemplo:

1. Y : Duração, em horas, de uma lâmpada de certa marca.

A experiência sugere que esta distribuição deve ser assimétrica- grande proporção de valores entre 0 e 500 horas e pequenaproporção de valores acima de 1500 horas

Função Densidade da Normal

I A área na �gura é calculada a partir da chamada função densidadeda distribuição normal.

I A expressão da função densidade da distribuição normal é dada por

f (x) =1√2πσ

exp

{− (x − µ)2

2σ2

}

I µ é a média e pode assumir valores em um campo de variaçãoamplo (−∞ < µ <∞)

I σ2 é a variância, e só assume valores positivos (σ2 > 0)

I Apesar da complexidade da expressão, a utilizaremos para cálculo deprobabilidades de uma forma fácil, através do uso de uma tabela decálculo de probabilidades, com base na chamada distribuiçãonormal padrão.

Grá�co da distribuição normal

Características da Distribuição Normal

I Assintótica em relação ao eixo das abscissas;

I Simétrica em torno do seu valor central, ou seja: valores de média,mediana e moda são iguais.

I Temos uma notação apropriada para representar uma variávelaleatória com distribuição normal. Ou seja, quando X for umavariável aleatória que possuir distribuição normal, temos que

X ∼ N(µ, σ2

)I Valores concentrados em torno da tendência central. No grá�co, as

áreas (probabilidades) para um, dois e três desvios padrões em tornoda média são, respectivamente:

Parâmetros da Distribuição Normal

I A distribuição normal depende dos parâmetros µ e σ2

I Curvas normais com mesma variância, porém com médias diferentes(µ2 > µ1).

In�uência de σ2 na curva da Distribuição Normal

I Curvas normais com mesma média, porém com variâncias diferentes(σ2

2> σ2

1).

Cálculo de probabilidades

P(a < X < b)

Área sob a curva e acima do eixo horizontal(X ) entre a e b

Distribuição Normal Padronizada

I Para calcular probabilidades associadas à distribuição normalapresentadas anteriormente, costuma-se transformar a variáveloriginal do problema X , em unidades padronizadas. Ou seja, éde�nida uma variável Z , onde

Z =X − µσ

I Com a transformação, temos um modelo bem simples:Z ∼ N (0, 1), chamada distribuição normal padrão.

I Com isso, �ca fácil determinar as probabilidades associadas à umadeterminada variável aleatória, pois existe uma tabela especí�ca decálculo de probabilidades com base na distribuição normalpadronizada.

Uso da tabela da distribuição normal padrão

I Denotamos: A(z) = P(Z ≤ z), para todo z ≥ 0.

EXEMPLO

Calcular P(Z ≤ 0, 32)

Logo, P(Z ≤ 0, 32) = A(0, 32) = 0, 6255

continuação

continuação

EXEMPLO

Calcular P(0 < Z ≤ 1, 71)

Regra: P(x < Z < y) = A(y)− A(x)

Logo, P(0 < Z ≤ 1, 71) = A(1, 71)− A(0) = 0, 9564− 0, 5 = 0, 4564

EXEMPLO

Calcular P(1, 32 < Z ≤ 1, 79)

Regra: P(x < Z < y) = A(y)− A(x)

Logo,P(1, 32 < Z ≤ 1, 79) = A(1, 79)−A(1, 32) = 0, 9633− 0, 9066 = 0, 0567

EXEMPLO

Calcular P(Z ≥ 1, 5)

Logo,P(Z ≥ 1, 5) = 1− P(Z < 1, 5) = 1− A(1, 5) = 1− 0, 9332 = 0, 0668

EXEMPLO

Calcular P(Z ≤ −1, 3)

Logo, P(Z ≤ −1, 3) = A(−1, 3) = 0, 0968

EXEMPLO

Calcular P(−1, 5 < Z ≤ 1, 5)

Regra: P(x < Z < y) = A(y)− A(x)

Logo,P(−1, 5 < Z ≤ 1, 5) = A(1, 5)− A(−1, 5) = 0, 9331− 0, 0668 = 0, 8664

EXEMPLO

Calcular P(−1, 32 < Z ≤ 0)

Regra: P(x < Z < y) = A(y)− A(x)

Logo, P(−1, 32 < Z ≤ 0) = A(0)−A(−1, 32) = 0, 9066− 0, 5 = 0, 4066

EXEMPLO

Calcular P(−2, 30 < Z ≤ −1, 49)

Regra: P(x < Z < y) = A(y)− A(x)

Logo, P(−2, 30 < Z ≤ −1, 49) = A(−1, 49)− A(−2, 30) =0, 9066− 0, 5 = 0, 4066

EXEMPLO

Calcular P(−1, 0 < Z ≤ 2, 0)

Regra: P(x < Z < y) = A(y)− A(x)

Logo,P(−1, 0 < Z ≤ 2, 0) = A(2, 0)− A(−1, 0) = 0, 9772− 0, 1586 = 0, 8186

EXEMPLO

Como encontrar o valor da distribuição N (0, 1) tal queP(Z ≤ z) = 0, 975?

Note que z é tal que A(z) = 0, 975. Pela tabela, z = 1, 96.

EXEMPLO

Como encontrar o valor da distribuição N (0, 1) tal queP(0 < Z ≤ z) = 0, 4975?

Note queP(0 < Z ≤ z) = 0, 4975 =⇒ A(z)− A(0) = 0, 4975 =⇒ A(z) = 0, 9975.Pela tabela, z = 2, 81.

EXEMPLO

Como encontrar o valor da distribuição N (0, 1) tal que P(Z ≥ z) = 0, 3?

Note que P(Z ≥ z) = 0, 3 =⇒ 1− P(Z < z) = 0, 3 =⇒ A(z) = 0, 7.Pela tabela, z = 0, 53.

EXEMPLO

Como encontrar o valor da distribuição N (0, 1) tal queP(Z ≥ z) = 0, 975?

Note queP(Z ≥ z) = 0, 975 =⇒ 1− P(Z < z) = 0, 975 =⇒ A(z) = 0, 025. Pelatabela, z = −1, 96.

EXEMPLO

Como encontrar o valor da distribuição N (0, 1) tal queP(Z ≤ z) = 0, 10?

Note que pela tabela, z = −1, 28.

EXEMPLO

Como encontrar o valor da distribuição N (0, 1) tal queP(−z < Z ≤ z) = 0, 80?

Note neste caso que P(Z < −z) = P(Z > z) = 0, 1 Logo, pela tabela,P(Z < z) = A(z) = 0, 90 e assim, z = 1, 28.

EXEMPLO

Seja X ∼ N (10; 64)(µ = 10, σ2 = 64 e σ = 8

)Calcular P(6 ≤ X ≤ 12)

I Note que P(6 ≤ X ≤ 12) = P(6−10

8≤ X−10

8≤ 12−10

8

)=

P (−0, 5 < Z < 0, 25)

I Logo, P (−0, 5 < Z < 0, 5) = A(0, 25)− A(−0, 5) =0, 5987− 0, 3085 = 0, 2902.

EXEMPLO

I Suponha que o comprimento médio de recém-nascidos do sexofeminino não-portadores de anomalias seja 48,54cm. Além disso,sabemos que o desvio padrão da variável é igual a 2,5cm.

I Qual é a probabilidade de haver na população indivíduos comcomprimento maior ou igual à 48,54?

Resposta: Queremos então obter P(X ≥ 48, 54). Logo:

P(X ≥ 48, 54) = P

(X − µσ

≥ 48, 54− 48, 542, 5

)= P(Z ≥ 0).

A tabela fornecida calcula probabilidades da forma P(X ≤ x) ouP(X < x). Por isso,

P(Z ≥ 0) = 1− P(Z < 0) = 1− 12=

12

continuação

I Qual é a probabilidade do comprimento ser menor que 44,79cm?

Resposta:

P(X < 44, 79) = P

(X − µσ

<44, 79− 48, 54

2, 5

)= A(−1, 5) = 0, 0668

continuação

I Qual é a probabilidade do comprimento ser superior à 47,29cm?

Resposta:

P(X > 47, 29) = P

(X − µσ

>47, 29− 48, 54

2, 5

)= P(Z > −0, 5)

Novamente, é importante lembrar que a tabela fornecida calculaprobabilidades da forma P(X ≤ x) ou P(X < x). Por isso,

P(Z > −0, 5) = 1− P(Z < −0, 5) = 1− 0, 3085 = 0, 6915

continuação

I Qual é a probabilidade de indivíduos terem comprimento entre46,04cm e 51,04cm?

Resposta:

P(46, 04 ≤ X ≤ 51, 04) = P

(46, 04− 48, 54

2, 5≤ X − µ

σ≤ 51, 04− 48, 54

2, 5

)= P(−1 ≤ Z ≤ 1)

I No caso da distribuição normal padrão, temos uma propriedadeespecial:

P(a ≤ Z ≤ b) = P(Z ≤ b)− P(Z ≤ a)

I Logo,

P(−1 ≤ Z ≤ 1) = P(Z ≤ 1)−P(Z ≤ −1) = 0, 8643−0, 1587 = 0, 7056

continuação

I Qual é o limite inferior nas crianças com maior comprimento, cujopercentual é de 5% na população?

Resposta: Neste tipo de situação, faremos o caminho inverso. Aoinvés de encontrar a probabilidade, precisamos encontrar o menorvalor dentre os maiores comprimentos. Sabemos que as maiorescrianças correspondem à 5%. Ou seja, precisamos então encontrar ovalor de x tal que

P

(Z ≤ x − 48, 54

2, 5

)= 0, 95

Logo, pesquisando na tabela, vemos então que

x − 48, 542, 5

= 1, 65 ∴ x = 1, 65× 2, 5+ 48, 54 = 52, 67cm

Ou seja, 5% das crianças nasce com comprimento superior à 52,67.Neste exercício o valor de x é chamado de percentil 95.

Comentários adicionais da distribuição normal

EXEMPLO

I Suponha que temos X variável aletória com distribuição normal commédia 60 e variância igual a 64. Ou seja: X ∼ N (60, 64).

I Considerando as áreas sob a distribuição (probabilidades) em relaçãoao desvio padrão, seria possível a�rmar para este exemplo que

P(µ± σ) = P(52 ≤ X ≤ 68) = 0, 6826

P(µ± 2σ) = P(44 ≤ X ≤ 76) = 0, 9546

P(µ± 3σ) = P(36 ≤ X ≤ 84) = 0, 9974