Unidade de Ensino Descentralizada de Colatina 2006/2 ...E7ao... · O número de chamadas numa...

13
1 Unidade de Ensino Descentralizada de Colatina Coordenadoria de Informática Disciplina: Probabilidade e Estatística Prof. Leandro Melo de Sá 2006/2 Unidade 3 – DISTRIBUIÇÕES DE PROBABILIDADE Conceitos básicos * Variável aleatória: É uma variável (geralmente representada por x) que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento. Ex. Estatura dos alunos; número de alunos que compareceram à aula; número de mulheres entre 10 empregados recém-admitidos; número de acidentes com aviões de uma determinada empresa entre sete acidentes aéreos selecionados aleatoriamente. * Variável aleatória discreta: admite um número finito de valores ou tem uma quantidade enumerável de valores. Ex. número de expectadores que vêem um filme, número de passageiros num ônibus. * Variável aleatória contínua: pode tomar um número infinito de valores, e esses valores podem ser associados a mensurações em um escala contínua, de tal forma que não haja lacunas ou interrupções. Ex. Voltagem na bateria de um nobreak, que pode ser qualquer valor entre 0 e 12 Volt. Além de identificar valores de uma variável aleatória, podemos freqüentemente atribuir uma probabilidade a cada um desses valores. Quando conhecemos todos os valores de uma variável aleatória juntamente com as suas respectivas probabilidades, temos uma distribuição de probabilidades. Distribuição de probabilidades Fornece a probabilidade de cada valor de uma variável aleatória. Ex. 1. Lançamento de um dado não viciado: P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6 = 0,167 Distribuição de probabilidade x P(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 6 5 4 3 2 1 0,15 0,10 0,05 0,00 Freqüência relativa Ex. 2. Lançamento de um dado viciado: P(1) = P(2) = P(4) = P(5) = P(6) = 1/10; P(3) = 5/10 Distribuição de probabilidade x P(x) 1 1/10 2 1/10 3 5/10 4 1/10 5 1/10 6 1/10 6 5 4 3 2 1 0,5 0,4 0,3 0,2 0,1 0,0 Freqüência relativa * Condições para uma distribuição de probabilidades: Qualquer distribuição de probabilidades deve satisfazer as duas condições seguintes: 1. () = 1 x P , onde x assume todos os valores possíveis. 2. () 1 0 x P , para todos os valores de x.

Transcript of Unidade de Ensino Descentralizada de Colatina 2006/2 ...E7ao... · O número de chamadas numa...

1

Unidade de Ensino Descentralizada de Colatina Coordenadoria de Informática Disciplina: Probabilidade e Estatística Prof. Leandro Melo de Sá

2006/2

Unidade 3 – DISTRIBUIÇÕES DE PROBABILIDADE

→ Conceitos básicos * Variável aleatória: É uma variável (geralmente representada por x) que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento. Ex. Estatura dos alunos; número de alunos que compareceram à aula; número de mulheres entre 10 empregados recém-admitidos; número de acidentes com aviões de uma determinada empresa entre sete acidentes aéreos selecionados aleatoriamente. * Variável aleatória discreta: admite um número finito de valores ou tem uma quantidade enumerável de valores. Ex. número de expectadores que vêem um filme, número de passageiros num ônibus. * Variável aleatória contínua: pode tomar um número infinito de valores, e esses valores podem ser associados a mensurações em um escala contínua, de tal forma que não haja lacunas ou interrupções. Ex. Voltagem na bateria de um nobreak, que pode ser qualquer valor entre 0 e 12 Volt. Além de identificar valores de uma variável aleatória, podemos freqüentemente atribuir uma probabilidade a cada um desses valores. Quando conhecemos todos os valores de uma variável aleatória juntamente com as suas respectivas probabilidades, temos uma distribuição de probabilidades. → Distribuição de probabilidades Fornece a probabilidade de cada valor de uma variável aleatória. Ex. 1. Lançamento de um dado não viciado: P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6 = 0,167

Distribuição de probabilidade x P(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6

654321

0,15

0,10

0,05

0,00

Freq

üênc

ia re

lativ

a

Ex. 2. Lançamento de um dado viciado: P(1) = P(2) = P(4) = P(5) = P(6) = 1/10; P(3) = 5/10

Distribuição de probabilidade x P(x) 1 1/10 2 1/10 3 5/10 4 1/10 5 1/10 6 1/10

654321

0,5

0,4

0,3

0,2

0,1

0,0

Freq

üênc

ia re

lativ

a

* Condições para uma distribuição de probabilidades: Qualquer distribuição de probabilidades deve satisfazer as duas condições seguintes: 1. ( )∑ = 1xP , onde x assume todos os valores possíveis.

2. ( ) 10 ≤≤ xP , para todos os valores de x.

2

Ex 3. a) P(x) = x/5 (onde x assume os valores 0, 1, 2 e 3) define uma distribuição de probabilidades?

( )∑ ≠=+++=+++= 156

53

52

510)3()2()1()0( PPPPxP .

Ex 3. b) P(x) = x/3 (onde x assume os valores 0, 1 e 2) define uma distribuição de probabilidades?

( )∑ ==++=++= 133

32

310)2()1()0( PPPxP .

* Média, variância e desvio-padrão numa distribuição de probabilidades. Existem três características extremamente importantes num conjunto de dados (amostra): (1) média, (2) desvio-padrão e (3) forma da distribuição (sino). O histograma permite-nos visualizar a forma da distribuição. 1. Média

( )[ ]∑= xxPµ 2. Variância

( ) ( )[ ] ( )[ ]{ }∑ ∑ −=−= 2222 µµσ xPxxPx 3. Desvio-padrão

( )[ ]{ } 22 µσ −= ∑ xPx

Ex. 4. Obtenha as probabilidades da distribuição P(x) = x/3 (onde x assume os valores 0, 1 e 2) e determine a média, a variância e o desvio-padrão.

x P(x) x.P(x) x2 x2.P(x) 0 0 0 0 0 1 1/3 1/3 1 1/3 2 2/3 4/3 4 8/3

Total ( ) 133

==∑ xP ( )[ ]∑ xxP = 5/3 ( )[ ]∑ xPx 2 = 9/3 = 3

Média: ( )[ ] 67,13/5 ≅== ∑ xxPµ

Variância: ( )[ ] ( ) 9/29/)2527(9/253/93/53/9 2222 =−=−=−=−= ∑ µσ xPx

Desvio-padrão: ( )[ ]{ } 47,03/29/222 ===−= ∑ µσ xPx

Ex. 5. A tabela abaixo representa a distribuição de probabilidades do número de acidentes com a USAir, dentre sete acidentes selecionados aleatoriamente (supondo que os acidentes são eventos independentes e aleatórios). Determine o número médio de acidentes com a USAir (dentre sete), a variância e o desvio-padrão.

x P(x) x.P(x) x2 x2.P(x) 0 0,210 0,000 0 0,000 1 0,367 0,367 1 0,367 2 0,275 0,550 4 1,100 3 0,115 0,345 9 1,035 4 0,029 0,116 16 0,464 5 0,004 0,020 25 0,100 6 0+ 0,000 36 0,000 7 0+ 0,000 49 0,000

Total ( )∑ xP = 1,000 ( )[ ]∑ xxP = 1,398 ( )[ ]∑ xPx 2 = 3,066

Média: ( )[ ] 4,1398,1∑ ≅== xxPµ acidentes.

Variância:

3

( )[ ] 1,1111596,1398,1066,3 2222 ≅=−=−= ∑ µσ xPx acidentes2 Desvio-padrão:

( )[ ]{ } 1,1054323,1111596,122 ≅==−= ∑ µσ xPx acidentes

* Valor esperado ou esperança. A média de uma variável aleatória discreta é o resultado médio teórico de um número infinito de repetições do experimento. Podemos encarar essa média como o valor esperado no sentido que é o valor médio que esperaríamos obter se o número de repetições do experimento se prolongasse indefinidamente. O valor esperado de uma variável discreta é denotado por E e representa o valor médio dos resultados.

( )[ ]∑ == µxxPE A média de uma variável aleatória discreta coincide com o seu valor esperado! → Distribuições teóricas de probabilidades de variáveis aleatórias. Existem diversas distribuições teóricas de probabilidades, tanto para variáveis discretas como para variáveis contínuas. Exemplos de distribuições de probabilidades são dados no quadro ao lado. A aplicação das distribuições de probabilidades depende da natureza da variável e do fenômeno que ela representa. O número de chamadas numa central telefônica é dado pela distribuição de Poisson; o tempo de vida de um equipamento é dado pela distribuição Exponencial. Em transmissão de sinais usa-se a distribuição de Erlang.

Exemplos de distribuições de probabilidade. Distribuições de probabilidade

Discretas Contínuas Bernoulli Uniforme Binomial Exponencial Poisson Erlang Geométrica Gamma Pascal Beta Série-log Weibull Multinomial Normal Hipergeométrica Lognormal

→ Distribuição binomial (possuem aplicação em controle de qualidade, análise de eleitores, pesquisa médica, serviço de inteligência militar e propaganda, etc.) São indicadas para experimentos que têm a característica de apresentarem exatamente dois resultados complementares: em processos industriais, as peças falham ou não falham; na zootecnia, o filhote é macho ou fêmea; na medicina, o paciente vive ou morre; na propaganda, um consumidor reconhece o produto, ou não. * Condições para um experimento binomial: 1- Deve comportar um número fixo de provas (repetições, tentativas, ensaios, testes, provas, trials). 2- Os testes devem ser independentes. 3- Cada teste deve ter todos os resultados classificados em duas categorias: sucesso (s) ou falha (f) (insucesso). 4- As probabilidades devem permanecer constantes para cada teste. P(s) = p; P(f) = 1 – p = q n denota o número fixo de testes x denota o número específico de sucessos em n testes, podendo ser qualquer inteiro entre 0 e n. p denota a probabilidade de sucesso em um dos n testes q denota a probabilidade de falha em um dos n testes P(x) denota a probabilidade de obter exatamente x sucessos em n testes. → Revisão de fatorial. * Notação: O símbolo fatorial (!) denota o produto dos inteiros positivos em ordem decrescente. Por exemplo: 4! = 4.3.2.1 = 24. Por definição, 0! = 1. (muitas calculadoras têm a tecla !) * Regra do fatorial: Seja n um número inteiro positivo. Então: n! = n× (n – 1)× (n – 2)× (n – 3)× ... × [n – (n - 1)]. Ex. 6. Dado que 10% das pessoas são canhotas, suponha que queiramos achar (a) a probabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes; (b) a probabilidade de obter ao menos 3 estudantes canhotos. n = 15; x = 3; p = 0,10; q = 1 – 0,10 = 0,90 (a) Podemos resolver esse item por três métodos diferentes: 1. Através da fórmula da probabilidade binomial

4

( ) ( )( )xnx qp

xxnnxP −

−= ..

!!!

; para x = 0, 1, 2, 3, ... , n.

onde: o termo ( ) !!!

xxnn

−* representa o número de maneiras como podemos dispor x sucessos e (n – x) falhas;

e o termo ( )xnx qp −. representa a probabilidade de x sucessos em n provas para determinada ordem.

( ) ( )( ) ( ) ( )( )( ) 129,0282429536,0001,04559,0.1,0.

!3!12!159,0.1,0.

!3!315!153 1233153 ===

−= −P

2. Através da Tabela A-1 P(x = 3) = 0,129 3. Através do MINITAB Probability Density Function Binomial with n = 15 and p = 0,100000 x P( X = x) 3,00 0,1285 (b) Para resolver esse item usando a fórmula da distribuição binomial, devemos aplicar a fórmula pelo menos três vezes, o que muitas vezes pode ser tedioso. Portanto, objetivando facilitar a resolução, devemos lançar mão da Tabela A-1 ou usar o MINITAB. Usando a Tabela A-1, temos: P(x ≥ 3) = P(3) + P(4) + P(5) + ... + P(15) = 0,129 + 0,0343 + 0,010 + ... + 0 = 0,184. Ou então: P(x ≥ 3) = 1 – P(x < 3) = 1 - [P(0) + P(1) + P(2)] = 1 – (0,206 + 0,343 + 0,267) = 1 - 0,816 = 0,184. → Média, variância e desvio-padrão da distribuição binomial * média: µ = n.p * variância σ2 = n.p.q * desvio-padrão

qpn ..=σ Ex. 7. Determinar a média, a variância e o desvio-padrão para os acidentes da USAir do exemplo 5. n = 7; p = 0,20 e q = 0,80 µ = n.p = 7×0,20 = 1,4 σ2 = n.p.q = 7×0,20×0,80 = 1,1

1,112,1.. === qpnσ Ex. 8. Alguns casais preferem ter filhos do sexo feminino, porque as mães são portadoras de um distúrbio recessivo que é herdado por 50% de seus filhos, mas por nenhuma de suas filhas. O método Ericsson de seleção de sexo tem uma taxa admitida de 75% de sucesso. Suponha que 100 casais utilizem o método Ericsson, com o resultado de que, dentre 100 recém-nascidos, há 75 meninas. (a) Suponha que o método Ericsson não produza efeito, e admitindo que menino e menina sejam igualmente prováveis, determine a média e o desvio-padrão do número de meninas em um grupo de 100 crianças. (b) Interprete os valores da parte (a) para determinar se o resultado de 75 meninas em 100 bebês confirma a alegação da eficiência do método Ericsson. (a) x = número de meninas em 100 nascimentos; n = 100; p = 0,5 e q = 0,5 µ = n.p = 100×0,5 = 50

55,05,0100.. =××== qpnσ (b) x = µ ± 2σ = 50 ± 2×5 = 50 ± 10; (40 ≤ x ≤ 60)

* O termo ( ) !!

!xxn

n−

= nCr pode ser determinado em calculadoras científicas (e.g., CASIO fx-82SUPER FRACTION) usando

os seguintes passos: (1) digitar o valor de n; (2) acionar a tecla nCr; (3) digitar o valor de x; (4) digitar a tecla =

5

5525

55075

==−

=−

µxz

Esses dois últimos resultados indicam que o nascimento de 75 meninas não parece ocorrer por puro acaso. → Usando o programa MINITAB Os valores de probabilidades de uma distribuição binomial podem ser obtidos para determinados valores de n e p através do programa MINITAB. A distribuição de probabilidades da variável binomial do exemplo 6 pode ser obtida no programa MINITAB usando-se os seguintes comandos: Digite o(s) valor(es) da variável x na coluna C1. Em seguida acesse o menu: Calc Probability Distributions Binomial Forneça os valores de n (trials) e p (ver janela abaixo), e obtenha a distribuição conforme indicado a seguir.

→ Distribuição normal Uma variável aleatória contínua tem distribuição normal de essa distribuição é simétrica e apresentar a forma de sino. É também conhecida como distribuição de Gauss ou Gaussiana. Seja x uma variável aleatória contínua; x terá distribuição normal se:

2

21

21)(

= σµ

πσ

x

exf , onde -∞ < x < ∞

e: µ denota a média da distribuição; σ denota o desvio-padrão da distribuição; π vale 3,14159...; e vale 2,7182....

A expressão mostra que qualquer distribuição normal é determinada por dois parâmetros: a média µ e o desvio-padrão σ. Uma distribuição de probabilidade de uma variável discreta deve satisfazer as seguintes condições: (1) ( )∑ = 1xP , onde x assume todos os valores possíveis.

(2) ( ) 10 ≤≤ xP , para todos os valores de x. O gráfico de uma distribuição discreta de probabilidade é dito histograma de probabilidade. O gráfico de uma distribuição contínua de probabilidade é chamado curva de densidade e deve satisfazer as seguintes propriedades: (1) A área total sob a curva deve ser igual a 1. (2) Todo ponto da curva deve ter uma altura vertical não inferior a 0. Ex. 9. As temperaturas em um processo de fabricação são controladas de modo a variarem entre 0o C e 5º C com todos os valores igualmente prováveis e iguais a 0,2. (a) Construa a curva de densidade; (b) determine a probabilidade de escolher aleatoriamente uma temperatura entre 1º C e 4º C.

6

(a)

543210

0,2

0,1

0,0

Temperatura (oC)

P(x)

(b) P(1º C ≤ x ≤ 4º C) = área = 3×0,2 = 0,6. Essa distribuição em que todos os valores da variável aleatória são igualmente prováveis é chamada distribuição uniforme.

Uma curva de densidade é o gráfico de uma variável aleatória contínua, de forma que a área sob a curva é 1, estabelecendo-se uma correspondência entre área e probabilidade. A curva de densidade de uma distribuição normal tem a forma mais complicada de um sino o que torna mais difícil achar as áreas. Entretanto, há uma correspondência entre área e probabilidade. → Distribuição normal padronizada É uma distribuição de probabilidade que tem média igual a 0 e desvio-padrão igual a 1. Seja z uma variável aleatória contínua; z terá distribuição normal padronizada se:

( )2

21

21)(

zezf

−=

π, onde -∞ < z < ∞

e: A área total sob a curva é 1!

* Determinação da probabilidade conhecendo o escore z: É dada através da Tabela A-2 que inclui áreas (ou probabilidades) para muitas regiões diferentes. Escore z: distância ao longo da escala horizontal no gráfico; recorrer à coluna mais a esquerda (e à linha superior) da Tabela A-2. Área (ou probabilidade): região sob a curva; recorrer aos números no corpo da Tabela A-2. Ex. 10. A temperatura de congelamento da água (0o C) foi medida em vários termômetros. O valor médio das medidas foi µ = 0,0o C e o desvio-padrão foi σ = 1,00o C. Admita que a distribuição de freqüência dos erros se assemelhe a uma distribuição normal. Escolhido aleatoriamente um termômetro, determine a probabilidade de que no ponto de congelamento da água o termômetro marque (a) entre 0o C e 1,58º C; (b) entre -2,43º C e 0o C; (c) uma leitura superior a 1,27º C; (d) entre 1,20º C e 2,30º C. (a)

P(0º C ≤ z ≤ 1,58º C) = 0,4429.

(b)

P(-2,43º C ≤ z ≤ 0º C) = P(0º C ≤ z ≤ 2,43º C) = 0,4925.

(c)

P(z > 1,27º C) = P(z > 0º C) – P(0o C ≤ z ≤ 1,27º C) = 0,5 - 0,3980 = 0,1020.

(d)

P(1,20º C ≤ z ≤ 2,30º C) = P(0º C ≤ z ≤ 2,30º C) – P(0o C ≤ z ≤ 1,20º C) = 0,4893 - 0,3849 = 0,1044.

7

* Determinação do escore z conhecendo a probabilidade: 1- Identificar a probabilidade que representa uma área delimitada pela linha do centro. 2- Localizar essa probabilidade na Tabela A-2. 3- Identificar o valor z correspondente. Ex. 11. Considere os termômetros com leituras distribuídas normalmente com média 0o C e desvio-padrão 1º C do exemplo 10. (a) Determine a temperatura correspondente ao 95º percentil; (b) determine o 10º percentil. (a)

1,645º C = P95.

(b)

-1,28º C = P10.

→ Distribuições normais não-padronizadas São aplicadas a variáveis aleatórias contínuas, distribuídas normalmente, com média diferente de zero, desvio-padrão diferente de 1, ou ambos. Para padronizar usamos a fórmula (:

σµ−

=xz

* Determinação da probabilidade conhecendo o escore z: 1- Desenhar o gráfico com a área de interesse 2- Usar a fórmula de padronização 3- Usar a Tabela A-2 para obter a probabilidade P.

Ex. 12. As alturas das mulheres têm distribuição normal com média igual a 63,6 in. (161,5 cm) e desvio-padrão de 2,5 in. (6,35 cm). Selecionada aleatoriamente uma mulher (a) determine a probabilidade de a sua altura estar entre 63,6 in. (161,5 cm) e 68,6 in. (174,2 cm); (b) para se adaptar a uma espaçonave russa Soyuz, uma astronauta deve ter altura entre 64,5 in. (163,8 cm) e 72 in. (183,9 cm). Determine a porcentagem das mulheres americanas que satisfazem essa condição; (c) Entre 500 mulheres americanas selecionadas aleatoriamente, quantas satisfazem aquela condição? (d) O exército americano exige que a altura das mulheres esteja entre 58 in. (147,3 cm) e 80 in. (203,2 cm). Determine a porcentagem das mulheres que satisfazem esta exigência. (a)

05,2

6,636,63=

−=z ; 00,2

5,26,636,68

=−

=z

z = 2,00; P = 0,4772 P(63,6 < x < 68,6) = P(0 < z < 2,00) = 0,4772

(b)

36,05,2

6,635,64=

−=z ; 36,3

5,26,6372

=−

=z

z = 0,36; P = 0,1406; z = 3,36; P = 0,4999 Área B = Área (A + B) – Área (A) Área B = 0,4999 – 0,1406 = 0,3593 P(64,5 < x < 72) = P(0,36 < z < 3,36) = 0,3593 = 35,93%

z

σµ−

=xz

8

(c) 500×0,3593 = 179,65 ≅ 179 mulheres (d)

24,25,2

6,6358−=

−=z ; 56,6

5,26,6380

=−

=z

z = -2,24; P = 0, 4875; z = 6,56; P = 0,4999 Área = Área (A + B) = 0,4875 + 0,4999 = 0,9874 P(58,0 < x < 80,0) = P(-2,24 < z < 6,56) = 0,9874 = 98,74%

* Cálculo de valores (escore z) conhecendo a probabilidade: 1- Desenhar o gráfico com a área de interesse e o valor de x procurado 2- Usar a Tabela A-2 e identificar o valor de z 3- Usar a fórmula a seguir para obter o valor de x procurado. x = µ + σ × z Ex. 13. As alturas das mulheres têm distribuição normal com média igual a 63,6 in. (161,5 cm) e desvio-padrão 2,5 in. (6,35 cm). (a) Determine o P90, i.e., o 90º percentil que é a altura que separa os 90% superiores dos 10% inferiores; (b) determine o 20º percentil. (a)

x = µ + σ × z x = 63,6 + 2,5×1,28 x = 66,8 in. (169,7 cm) P90 = 66,8 in.

(b)

x = µ + σ × z x = 63,6 + 2,5× (-0,84) x = 61,5 in. (156,2 cm) P20 = 61,5 in.

→ Usando o programa MINITAB Os valores de probabilidades de uma distribuição normal podem ser obtidos através do programa MINITAB usando-se os seguintes comandos: Digite os valores da variável x na coluna C1. Em seguida acesse o menu: Calc Probability Distributions Normal Forneça os valores de µ e σ (ver janela abaixo), e obtenha a distribuição conforme indicado na figura a seguir.

Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1,00000 x P( X <= x) -2,4300 0,0075 0,0000 0,5000 1,2000 0,8849 1,2700 0,8980 2,3000 0,9893

9

Ex. 14. Resolver os itens (a) e (b) do exemplo 12 usando o MINITAB. Digitar os valores da variável x na coluna C1 e introduzir os valores de µ e σ no programa MINITAB. (a) P(63,6 < x < 68,6) = P(x < 68,6) - P(x < 63,6) = 0,9772 – 0,5000 = 0,4772 Cumulative Distribution Function (saída do MINITAB) Normal with mean = 63,6000 and standard deviation = 2,50000 x P( X <= x) 63,6000 0,5000 68,6000 0,9772

(b) P(64,5 < x < 72,0) = P(x < 72,0) - P(x < 64,5) = 0,9996 – 0,6406 = 0,3590 Cumulative Distribution Function (saída do MINITAB) Normal with mean = 63,6000 and standard deviation = 2,50000 x P( X <= x) 64,5000 0,6406 72,0000 0,9996

→ Teorema do Limite Central (TLC) O TLC é um dos conceitos mais importantes e mais úteis na estatística, pois constitui o fundamento para a estimativa de parâmetros populacionais e para o teste de hipóteses. Dado: 1. A variável aleatória x tem distribuição (que pode ser normal, ou não), com média µ e desvio-padrão σ. 2. Amostras de tamanho n são extraídas aleatoriamente dessa população. Conclusões: 1. Na medida em que o tamanho da amostra aumenta, a distribuição das médias amostrais x tende para uma distribuição normal. 2. A média das médias amostrais será o média populacional µ ( xµ = µ)

3. O desvio padrão das médias amostrais será nσ ( xσ = nσ )

Esquema ilustrativo do TLC.

* Regras práticas de uso comum: 1. Para amostras de tamanho n > 30, a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal. A aproximação melhora na medida em que aumenta o tamanho da amostra n.

10

2. Se a própria distribuição original tem distribuição normal, então as médias amostrais terão distribuição normal para qualquer tamanho amostral n.

Esquema ilustrativo da distribuição amostral das médias amostrais.

Ex. 15. Na engenharia humana e no projeto de produtos, freqüentemente é importante considerarmos os pesos das pessoas, de modo que não haja sobrecarga em aviões ou elevadores, as cadeiras não se quebrem, e não ocorram outros acontecimentos perigosos ou embaraçosos. Dado que a população de homens tem pesos distribuídos normalmente com média de 173 lb e desvio-padrão de 30 lb, determine a probabilidade de que (a) um homem escolhido aleatoriamente pese mais que 180 lb; (b) em 36 homens escolhidos aleatoriamente, o peso médio seja superior a 180 lb. (a)

23,030

173180=

−=

−=

σµxz

P(x > 180) = P(z > 0) - P(0 < z ≤ 0,23) = 0,5 - 0,0910 P(x > 180) = 0,4090 = 40,90%

(b) 173== µµ x

56

3036

30====

nxσσ

40,157

3630

173180==

−=

−=

x

xxz

σµ

P( x > 180) = P(z > 0) - P(0 < z < 1,40) = P( x > 180) = 0,5 - 0,4192 = 0,0808 = 8,08%

Ex. 16. Suponha que a população de temperaturas do corpo humano tenha média de 37º C, como se aceita em geral. Suponha também que o desvio-padrão da população seja de 0,344º C. Selecionada aleatoriamente uma amostra de tamanho n = 106 determine a probabilidade de se obter uma média de 36,78º C ou menos.

58,60334,0

22,0

106344,0

0,3778,36−=

−=

−=

−=

x

xxz

σµ

P( x < 36,78) = P(z < -6,58) = P(z > 0) - P(0 < z < 6,58) = P( x < 36,78) = 0,5 - 0,4999 = 0,0001 = 0,01%

11

→ A distribuição normal como uma aproximação da distribuição binomial. Nos casos em que o número de sucessos (x) e o número de testes (n) assumem valores elevados, inviabiliza o uso da Tabela A-1 e da fórmula da probabilidade binomial. Dessa forma, a distribuição binomial pode ser aproximada por uma distribuição normal. Se n.p ≥ 5 e n.q ≥ 5, então a variável aleatória binomial tem distribuição aproximadamente normal com média µ e desvio-padrão σ dados por: µ = n.p e qpn ..=σ . * Processo de aproximação pela normal: Passo 1: Verificar se a distribuição binomial é aplicável. Passo 2: Utilizar (se possível) programas estatísticos. Passo 3: Utilizar a Tabela A-1 (se possível). Passo 4: Utilizar a fórmula da probabilidade binomial (se viável, i. e., se o problema for facilmente resolvível). Passo 5: Verificar se n.p ≥ 5 e n.q ≥ 5, ou seja, se a variável aleatória binomial é convenientemente aproximada

pela distribuição normal. Passo 6: Determinar os valores dos parâmetros µ e σ, usando µ = n.p e qpn ..=σ . Passo 7: Identificar o valor discreto x que representa o número de sucessos no experimento binomial. Corrigir o

valor discreto x substituindo-o por x - 0,5 ou x + 0,5, conforme adequado†, traçar a curva normal com a

área de interesse e determinar o escore z usando a fórmula σ

µ−=

xz .

Passo 8: Consultar a Tabela A-2 para obter a área correspondente à probabilidade desejada. Ex. 17. Suponha que o quadro administrativo de sua faculdade tenha igual número de candidatos e candidatas ao emprego, e que 64 dos 100 funcionários recém-admitidos são homens. Estime a probabilidade de obter pelo menos 64 homens, se cada contratação é feita independentemente e sem qualquer discriminação de sexo. Com base no resultado, parece que a faculdade está fazendo discriminação quanto ao sexo? Passo 1: Distribuição binomial (com n = 100 testes independentes), com duas categorias (homem, mulher), com

probabilidade constante (0,5). Passo 2: Não se dispõe de computador. Passo 3: A Tabela A-1 não se aplica, pois n = 100 > 15. Passo 4: Para usar a fórmula da probabilidade binomial teríamos que aplicá-la 37 vezes, de 64 a 100. Passo 5: A distribuição binomial pode ser aproximada pela distribuição normal, pois n.p = 100×0,5 = 50 > 5 e

n.q = 100×0,5 = 50 > 5. Passo 6: µ = n.p = 100×0,5 = 50 e 5255,05,0100.. ==××== qpnσ . Passo 7: Pelo menos 64, i.e., um valor ≥ 64. Portanto o valor discreto deve ser igual a x = 64 – 0,5 = 63,5.

70,25

505,63=

−=

−=

σµxz

Passo 8: Da Tabela A-2, para z = 2,70, a área é 0,4965. Portanto, a área de interesse é: área = 0,5 – 0,4965 = 0,0035 = 0,35% (No MINITAB, área = 0,0035!).

† Para realizar a correção deve-se observar a afirmação feita e localizar a área de interesse como descrito a seguir: Afirmação: Área: Pelo menos x (inclui x ou mais) À direita de x – 0,5 Mais de x (não inclui x) À direita de x + 0,5 No máximo x (inclui x ou menos) À esquerda de x + 0,5 Menos de x (não inclui x) À esquerda de x – 0,5 Exatamente x Entre x – 0,5 e x + 0,5

12

→ Exercícios 1. Para resolver uma questão de paternidade, fazem-se testes de sangue em duas pessoas diferentes. Se x é o número dos que têm sangue do grupo A, então x pode ser 0, 1 ou 2, e as probabilidades correspondentes são 0,36, 0,48 e 0,16, respectivamente. Determine para a variável aleatória discreta x: (a) o valor esperado; (b) a média; (c) a variância; (d) o desvio-padrão. (a) 0,80, (b) 0,80, (c) 0,48, (d) 0,69 2. Se sua faculdade contrata os 4 próximos funcionários sem distinção de sexo e o conjunto de candidatos é grande, com números iguais de homens e mulheres, a tabela a seguir dá a distribuição de probabilidade do número x de mulheres contratadas. Complete a tabela e determine: (a) o valor esperado; (b) a média; (c) a variância; (d) o desvio-padrão. (2); (2); (1); (1)

x P(x) x.P(x) x2 x2.P(x) 0 0,0625 1 0,2500 2 0,3750 3 0,2500 4 0,0625

Total ( )∑ xP = ( )[ ]∑ xxP = ( )[ ]∑ xPx 2 =

3. Considere que um produto pode estar perfeito (B), com defeito leve (DL) ou com defeito grave (DG). Seja a seguinte distribuição do lucro (em R$), por unidade vendida desse produto:

Produto x P(x) B 6 0,7

DL 0 0,2 DG - 2 0,1

Calcule: (a) o valor esperado, (b) a variância e (c) o desvio-padrão do lucro. 4. A Mars, Inc. afirma que 20% de suas pastilhas de chocolate M&M são vermelhas. Determine a probabilidade de que em 15 pastilhas M&M escolhidas aleatoriamente: (a) exatamente 20% (ou seja, 3 pastilhas) sejam vermelhas usando a fórmula da probabilidade binomial; (b) exatamente 3 pastilhas sejam vermelhas usando a Tabela A-1; (c) exatamente 3 pastilhas sejam vermelhas usando o MINITAB; (d) pelos menos 3 pastilhas sejam vermelhas usando a fórmula da probabilidade binomial; (e) pelos menos 3 pastilhas sejam vermelhas usando a Tabela A-1; (f) pelos menos 3 pastilhas sejam vermelhas usando o MINITAB; (g) determine o número médio de pastilhas vermelhas; (h) determine a variância do número de pastilhas vermelhas; (i) determine o desvio-padrão do número de pastilhas vermelhas. (a) 0,25, (b) 0,25, (c) 0,25, (d) 0,602, (e) 0,602, (f) 0,602, (g) 3, (h) 2,4, (i) 1,55 5. De acordo com um instituto de pesquisa, 30% dos aparelhos de TV são sintonizados num determinado programa quando ele vai ao ar. Supondo que esse programa esteja sendo transmitido e que 15 TVs sejam escolhidas aleatoriamente: (a) determine a probabilidade de exatamente 5 TVs estarem sintonizadas naquele programa, usando a fórmula da probabilidade binomial; (b) usando a Tabela A-1; (c) usando o MINITAB. Determine a probabilidade de pelo menos 5 TVs estarem sintonizadas naquele programa, usando: (d) usando a Tabela A-1; (e) usando o MINITAB. Determine: (f) o número médio de TVs sintonizadas naquele programa; (g) a variância e (h) o desvio-padrão do número de TVs sintonizadas naquele programa. (0,2061); (0,206); (0,2061); (0,517); (0,5155); (4,5); (3,15); (1,77) 6. Dados históricos mostram que 5% dos itens provindos de um fornecedor apresentam algum tipo de defeito. Considerando um lote com 20 itens, calcular a probabilidade de: (a) haver algum item com defeito, usando a Tabela A-1; (b) haver exatamente dois itens defeituosos, usando a fórmula da probabilidade binomial; (c) haver mais de dois itens defeituosos, usando o MINITAB; (d) qual é o número esperado de itens defeituosos no lote? (e) e de itens bons? Determine: (f) a variância e (g) o desvio-padrão do número de itens defeituosos. 7. Os prazos da gravidez humana têm distribuição normal com média de 268 dias e desvio-padrão de 15 dias. Selecionada aleatoriamente uma mulher determine: (a) a probabilidade de sua gravidez durar 308 dias ou mais; (b) a probabilidade de sua gravidez ser inferior a 260 dias; (c) qual a porcentagem de crianças nascidas com ao menos três semanas de antecipação; (d) definindo como prematura uma criança cujo período de gestação esteja nos 4% inferiores, determine o prazo de gestação que separa as crianças prematuras das não-prematuras; (e) determine o 95o percentil dos prazos de gravidez; (f) se 25 mulheres escolhidas aleatoriamente são submetidas a uma dieta especial a partir do dia que engravidam, determine a probabilidade de os prazos de duração de sua

13

gravidez terem média inferior a 260 dias (admita que a dieta não produza efeito sobre o tempo de gravidez); (g) se as 25 mulheres têm realmente média inferior a 260 dias, há razão de preocupação para os médicos/nutricionistas? (a) 0,0038, (b) 0,2981, (c) 0,0808, (d) 242 dias, (e) 293 dias, (f) 0,0038 8. Um subfornecedor da IBM foi contratado para fabricar substratos de cerâmica, utilizados para transmitir sinais entre chips de silício para computador. As especificações exigem uma resistência entre 1,500 ohm e 2,500 ohms, mas a população tem resistências distribuídas normalmente com média de 1,978 ohm e desvio-padrão de 0,172 ohm. (a) Que percentagem dos substratos de cerâmica foge às especificações do fabricante? (b) Resolva novamente o item anterior usando o MINITAB. (c) Se as especificações exigidas forem modificadas de modo que 3% dos dispositivos sejam rejeitados por terem resistência muito baixa e 3% sejam rejeitados por terem resistência muito alta, determine os valores de separação para os dispositivos aceitáveis. (0,39%); (0,39%); (1,65 ohm e 2,30 ohm) 9. O padrão de qualidade recomenda que os pontos impressos por uma impressora estejam entre 3,7 e 4,3 mm. Uma impressora imprime pontos cujo diâmetro médio é igual a 4,00 mm e o desvio-padrão é 0,19 mm. Suponha que o diâmetro dos pontos tenha distribuição normal. (a) Qual é a probabilidade do diâmetro de um ponto dessa impressora estar dentro do padrão? (b) Resolva novamente o item anterior usando o MINITAB. (c) Qual deveria ser o desvio-padrão para que a probabilidade do item (a) atingisse 95%? 10. Uma análise dos números de horas por semana que os calouros universitários (nos EUA) dedicam ao estudo acusa média de 7,06 horas e desvio-padrão de 5,32 horas. Selecionados aleatoriamente 55 calouros, determine a probabilidade de seu tempo semanal médio de estudo exceder 7,00 horas. (0,5319) 11. As quantidades de precipitação anual do estado de Iowa aparentam ter distribuição normal com média 32,473 polegadas e desvio-padrão de 5,601 polegadas, (a) Escolhido um ano aleatoriamente, determine a probabilidade de a precipitação anual correspondente ser inferior a 29,000 polegadas. (b) Resolva novamente o item anterior usando o MINITAB. (c) Para uma década selecionada aleatoriamente, determine a probabilidade de a média das precipitações anuais ser inferior a 29,000 polegadas. (d) Como a parte (c) envolve uma amostra não superior a 30, por que podemos aplicar o teorema do limite central? (0,2676); (0,2676); (0,025) 12. O tempo para que um sistema computacional execute determinada tarefa é uma variável aleatória com distribuição normal, com média 320 segundos e desvio-padrão de 7 segundos. (a) Qual a probabilidade de a tarefa ser executada entre 310 e 330 segundos? (b) Resolva novamente o item anterior usando o MINITAB. (c) A tarefa é colocada para execução 200 vezes. Selecionadas aleatoriamente 50 execuções, qual a probabilidade de o tempo médio dessas execuções demorar mais do que 325 segundos? 13. Um hospital americano está fazendo uma campanha de doações, porque seu estoque de sangue do grupo O está baixo; o hospital necessita de 177 doadores de sangue do grupo O. Se 400 voluntários doam sangue, estime a probabilidade de que haja pelo menos 177 doadores com sangue do grupo O. Quarenta e cinco por cento dos americanos têm sangue do grupo O. (0,6368) 14. Atualmente, cerca de dois terços das companhias americanas fazem teste de uso de drogas em empregados recém-admitidos, e o resultado do teste em 3,8% dos empregados dá positivo. Uma determinada empresa testa 150 candidatos a emprego e constata que, em 10 deles, o teste foi positivo. Estime a probabilidade de 10 ou mais resultados positivos em 150 candidatos. Com base nesse valor, os 10 resultados positivos parecem uma cifra excepcionalmente alta? (0,0526) 15. Um exame de múltipla escolha consiste em 100 questões, cada uma com quatro possibilidades de escolha. A aprovação exige, no mínimo, 30% de acertos. Qual é a probabilidade de aprovação se o candidato comparece ao exame sem saber absolutamente nada, apelando apenas para o “palpite”?

Curiosidades