Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...
Transcript of Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...
Slide 1
Ana M. Abreu - 2006/07
Capítulo 3Modelos Estatísticos
Resenha
Variáveis Aleatórias
Distribuição Binomial
Distribuição de Poisson
Distribuição Normal
Distribuição t de Student
Distribuição Qui-quadrado
Slide 2
Ana M. Abreu - 2006/07
ResenhaEste capítulo aborda as
distribuições de probabilidade
tendo em conta os conhecimentos deestatistica descritiva apresentados no
Capítulo 1 e os de probabilidadeapresentados no Capítulo 2 .
As Distribuições de Probabilidade descrevem o que provavelmente acontecerá em vez de o
que realmente aconteceu.
Slide 3
Ana M. Abreu - 2006/07
Definiçõesv Uma variável aleatória é uma variável
(usualmente representada por X) que toma um certo valor numérico, determinado pelo acaso, de cada vez que a experiência érealizada.
v Uma distribução de probabilidade éum gráfico, tabela, ou fórmula que indicaa probabilidade correspondente a cadavalor da variável aleatória.
Slide 4
Ana M. Abreu - 2006/07
Definições
Uma variável aleatória discreta toma um nºfinito ou infinito numerável de valores.
Uma variável aleatória contínua toma um nºinfinito não numerável de valores, os quais podem ser associados com medidas numa escala contínua.
Slide 5
Ana M. Abreu - 2006/07
Propriedades das Distribuições de Probabilidade
P(x) = 1 onde x toma todos os valores possíveis.
Σ
0 ≤≤≤≤ P(x) ≤≤≤≤ 1 para qualquer valor de x.
Slide 6
Ana M. Abreu - 2006/07
Média, Variância e Desvio Padrão de uma Variável Aleatória
µ = ΣΣΣΣ [x • P(x)] Média
σσσσ2 = ΣΣΣΣ [(x – µ)2• P(x)] Variância
σσσσ2 = [ΣΣΣΣ x2
• P(x)] – µ2 Variância (forma reduzida)
σσσσ = ΣΣΣΣ [x 2• P(x)] – µ 2 Desvio Padrão
Slide 7
Ana M. Abreu - 2006/07
Definição
E = ΣΣΣΣ [x • P(x)]
O Valor Esperado de uma variável aleatória discreta é denotado por E, e representa a média dos resultados. Determina-se atravésdo valor de ΣΣΣΣ [x • P(x)].
Slide 8
Ana M. Abreu - 2006/07
Em resumo
Até agora aprendemos sobre:
v Combinar os métodos da estatística descritivacom os da probabilidade.
v Propriedades da distribuição de probabilidade.
v Média, variância e desvio padrão de uma variável aleatória.
v Variáveis aleatórias e distribuições de probabilidade.
v Valor esperado.
Slide 9
Ana M. Abreu - 2006/07
A Distribuição Binomial
Slide 10
Ana M. Abreu - 2006/07
Definições
A distribuição binomial verifica as seguintes condições:
1. A experiência tem um nº fixo de provas, n.
2. As provas são independentes. (O resultado de umaprova não afecta a probabilidade de ocorrência das restantes.)
3. Cada prova origina um de dois resultados possíveis: sucesso ou insucesso.
4. A probabilidade de sucesso, denotada por p, éconstante em cada prova.
Slide 11
Ana M. Abreu - 2006/07
Notação para a Distribuição Binomial
n denota o nº de provas (valor fixo à partida).
x denota um nº específico de sucessos em nprovas, logo x pode ser qualquer nº entre 0 e
n, inclusive.
p denota a probabilidade de sucesso em cada uma das n provas.
q denota a probabilidade de insucesso em cada uma das n provas.
P(x) denota a probabilidade de obter exactamente xsucessos em n provas (P(x)=P(X=x)).
Slide 12
Ana M. Abreu - 2006/07
Métodos para Determinaras Probabilidades com a
Distribuição Binomial
Vejamos três métodos possíveis para
determinar as probabilidades correspondentes
à variável aleatória X com distribuição binomial.
Slide 13
Ana M. Abreu - 2006/07
Método 1: Usando a Fórmula da Probabilidade na
Distribuição Binomial
P(X=x) = • px • qn-x(n – x)!x!
n !
para x = 0, 1, 2, . . ., nonde
n = nº de provas
x = nº de sucessos nas n provas
p = probabilidade de sucesso em cada prova
q = probabilidade de insucesso em cada prova (q = 1 – p)
Slide 14
Ana M. Abreu - 2006/07
Método 2: Usando uma Tabela de Probabilidades
Reproduz-se em baixo parte da tabela da binomial que
vamos usar. Com n = 5 e p = 0.2 na distribuição binomial,
as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são
0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373),
0.0512, 0.0064 e 0.0003, respectivamente.
n = 5 px .01 .05 .10 .200 .32771 .73732 .94213 .99334 .9997
Slide 15
Ana M. Abreu - 2006/07
Método 3:Usando a Tecnologia
Software Estatístico, Excel e algumas calculadoras
fornecem-nos as probabilidades da distribuição binomial.
Slide 16
Ana M. Abreu - 2006/07
Distribuição Binomial:Fórmulas
Desvio Padrão σσσσ = n • p • q
Média µ = n • p
Variância σσσσ 2 = n • p • q
onde
n = nº de provas
p = probabilidade de sucesso em cada uma das nprovas
q = probabilidade de insucesso em cada uma das nprovas
Slide 17
Ana M. Abreu - 2006/07
Esta situação pode ser resolvida através da distribuição binomial onde:
n = 14
p = 0.5q = 0.5
Usando as fórmulas da distribuição binomial, temos :
µ = (14)(0.5) = 7 raparigas
σσσσ = (14)(0.5)(0.5) = 1.871 raparigas
Exemplo
Determine a média e o desvio padrão para o nº de raparigas em 14 nascimentos.
Slide 18
Ana M. Abreu - 2006/07
Interpretação dos Resultados
Valores Máximos Usuais = µ + 2 σσσσValores Mínimos Usuais = µ – 2 σσσσ
É especialmente importante interpretar osresultados. Os valores dizem-se pouco usuaisse se encontrarem para além dos seguinteslimites:
Slide 19
Ana M. Abreu - 2006/07
Para esta distribuição binomial,
µ = 50 raparigas
σσσσ = 5 raparigas
µ + 2 σσσσ = 50 + 2(5) = 60µ - 2 σσσσ = 50 - 2(5) = 40
Em 100 nascimentos, é usual nascerem entre 40 e 60 raparigas. Assim, não é usual nascerem 68 raparigas.
Exemplo
Determine se é usual em 100 nascimentos, 68 serem raparigas.
Slide 20
Ana M. Abreu - 2006/07
A Distribuição de Poisson
Slide 21
Ana M. Abreu - 2006/07
Definição
A distribuição de Poisson é uma distribuição discreta que se aplica quando ocorre um acontecimento num intervalo especificado. A variável aleatória X representa o nº de ocorrências num determinado intervalo. O intervalo pode se referir a tempo, distância, área, volume, ou algum tipo de medida similar.
P(X=x)= onde e ≈≈≈≈ 2.71828µx • e
-µ
x!
Fórmula
Slide 22
Ana M. Abreu - 2006/07
Condições da Distribuição de Poisson
v A variável aleatória X designa o nº de acontecimentos nalgum intervalo. Assim, pode tomar quaisquer dos valores 0, 1, 2, …)
v Os acontecimentos têm que ser aleatórios.
v Os acontecimentos são independentes.
• Parâmetros
v A média é µ.
v O desvio padrão é σσσσ = µ .
Slide 23
Ana M. Abreu - 2006/07
Diferenças em relação àDistribuição Binomial
A distribuição de Poisson difere da distribuiçãobinomial nos seguintes aspectos fundamentais:
v A distribuição binomial é caracterizada peladimensão da amostra n e pela probabilidade de sucesso p, enquanto que a distribuição de Poisson é caracterizada apenas pela média µ.
v Numa distribuição binomial, os valores que a variável aleatória X pode tomar são 0, 1, . . . n, enquanto que na distribuição de Poisson a variávelX toma os valores 0, 1, . . . , sem limite superior.
Slide 24
Ana M. Abreu - 2006/07
Exemplo
Bombas da 2ª Guerra Mundial Em 1945 os alemãesbombardearam Londres com as bombas V2. A regiãolondrina está dividida em 576 distritos de superfíciessemelhantes, pelo que admitimos que cada distrito tem igual probabilidade de ser bombardeado. Calcula-se que o nº de bombas recebidas por Londres foi de 535.
Se um distrito for seleccionado ao acaso, determine a probabilidade de ter sido bombardeado com exactamente 2 bombas.
A distribuição de Poisson é adequada porque estamos a lidar com uma situação de ocorrência de acontecimentos (nº de bombas recebidas) num certo intervalo (distrito).
Slide 25
Ana M. Abreu - 2006/07
Exemplo
Assim, a probabilidade de um qualquer distrito ser atingido por exactamente 2 bombas é P(X=2) = 0.170.
O nº médio de bombas por distrito é
µ = 535 = 0.929576
Então, P(X=2) = 0.9292 e-0.929 = 0.170.2!
Slide 26
Ana M. Abreu - 2006/07
Cálculo da probabilidade na Distribuição de Poisson usando uma Tabela
Reproduz-se em baixo parte da tabela da distribuição de
Poisson que vamos usar. Com µ = 0.20, as probabilidades de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são
0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825),
0.001, e 0.0001, respectivamente.µ
x .05 .10 .15 .200 .81871 .98252 .99893 .99994 1.0000
Slide 27
Ana M. Abreu - 2006/07
Distribuição Normal
Slide 28
Ana M. Abreu - 2006/07
v Variável aleatória contínua
v Distribuição Normal
Caracterização
Figura 3-1
Fórmula 3-1
f(x) = σσσσ 2 ππππ
x-µµµµσσσσ
2( )e
-1
2
Slide 29
Ana M. Abreu - 2006/07
v Curva da Densidade (ou da função densidade de probabilidade) é o gráfico da distribuição de probabilidade de uma variável aleatória contínua.
Definições
1. A área total sob a curva é igual a 1.2. Todo o ponto sob a curva deve ter uma
ordenada de valor igual ou superior a zero.
Slide 30
Ana M. Abreu - 2006/07
Uso da Área para determinar a Probabilidade
Figura 3-2
Como a área total sob a curva é igual a 1, existe uma correspondência entre a área e a
probabilidade.
Slide 31
Ana M. Abreu - 2006/07
Alturas de Homens e Mulheres
Figura 3-3
Slide 32
Ana M. Abreu - 2006/07
DefiniçãoDistribuição Normal Standard :
a distribuição Normal que temmédia 0 e desvio padrão 1.
Figura 3-4
Slide 33
Ana M. Abreu - 2006/07
P(a < z < b) denota a probabilidade de z tomar valores entre
a e b
P(z > a)denota a probabilidade de z tomar valores maiores do
que a
P(z < a)denota a probabilidade de z tomar valores menores do
que a
Notação
Slide 34
Ana M. Abreu - 2006/07
Cálculo do valor de z correspondente a uma certa probabilidade
Figura 3-5Cálculo do Percentil 95
1.645
5% ou 0.05
(o valor de z será positivo)
Slide 35
Ana M. Abreu - 2006/07
Figura 3-6 Cálculo dos Percentis 2.5% e 97.5%
(Um dos valores de z será negativo e o outro positivo)
Cálculo do valor de z correspondente a uma certa probabilidade
Slide 36
Ana M. Abreu - 2006/07
Distribuições Normais não Standard
Se µµµµ ≠≠≠≠ 0 ou σ σ σ σ ≠≠≠≠ 1 (ou ambos), teremos que converter os valores usando a Fórmula 3-2; então, os procedimentos passam a ser os mesmos do que os usados com a distribuição Normal Standard.
Fórmula 3-2x – µσσσσz =
Slide 37
Ana M. Abreu - 2006/07
Figura 3-7
Conversão para a DistribuiçãoNormal Standard
x – µµµµσσσσz =
Slide 38
Ana M. Abreu - 2006/07
1. Não confunda valores de z com as correspondentes áreas. Os valores de z são distâncias ao longo do eixo horizontal enquanto que as áreas são regiões sob a curva da distribuição Normal. A tabela usada apresenta os valores de z na coluna à esquerda e na linha superior, enquanto que as áreas se encontram no “meio” da tabela.
2. Escolha o lado certo (direito/esquerdo) do gráfico.
3. Um valor de z deve ser negativo sempre que se encontre na metade esquerda da distribuição Normal.
4. As áreas (ou probabilidades) têm valores positivos ou nulos, mas nunca têm valores negativos.
Precauções a ter em conta
Slide 39
Ana M. Abreu - 2006/07
Cálculos usando a Tabela da distribuição Normal Standard
Seja Z a variável aleatória com distribuição Normal standard, ou seja, com valor médio zero e desvio padrão 1.Para calcular P(Z<0.32), é necessário consultar a tabela, na página referente aos valores positivos de z, como a seguir se indica:
z .00 .01 .020.0 .50800.1 .54780.2 .58710.3 .6255
Assim, P(Z<0.32)=0.6255.
Slide 40
Ana M. Abreu - 2006/07
Cálculos usando a Tabela da distribuição Normal Standard
De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se consultou a mesma tabela, embora na parte referente aos valores negativos de z.Por outro lado, para encontrar o valor de z correspondente a uma certa probabilidade, por exemplo, 0.975, o valor da probabilidade tem que ser procurado no interior da tabela para, só depois, determinar o valor de z que lhe corresponde.
z … .05 .06… …1.8 .96861.9 .9750
Assim, o valor de z correspondente à probabilidade 0.975 é1.96, ou seja, se P(Z<t)=0.975, então t=1.96.
Slide 41
Ana M. Abreu - 2006/07
Aproximação da Distribuição Binomial pela Distribuição Normal se:
np ≥≥≥≥ 5 e
nq ≥≥≥≥ 5
então µ = np e σσσσ = npq
e a variável aleatória tem uma
distribuição Normal
Slide 42
Ana M. Abreu - 2006/07
Procedimento para usar a Distribuição Normal para Aproximar a Distribuição
Binomial
1. Verifique que a distribuição Normal é uma aproximação adequada à distribuição Binomial confirmando que np ≥≥≥≥ 5 enq ≥≥≥≥ 5.
2. Determine os valores dos parâmetros µ e σσσσ calculando µ = np e σσσσ = npq.
3. Identifique o valor discreto de x (o nº de sucessos). Altere o valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5. Represente a curva da Normal e assinale os correspondentes valores de µ , σσσσ, e de x – 0.5 ou x + 0.5, conforme a situação.
4. Determine a área correspondente à probabilidade desejada.
Slide 43
Ana M. Abreu - 2006/07
Definição
Quando usamos a distribuição Normal (que é uma distribuição contínua) para
aproximar a distribuição Binomial (que éuma distribuição discreta), fazemos uma
correcção de continuidade ao valor discreto x na distribuição binomial
representando o valor x pelo intervalo de x – 0.5 a x + 0.5.
Slide 44
Ana M. Abreu - 2006/07
Figura 3-8
x = pelo menos 120= 120, 121, 122, . . .
x = mais do que 120= 121, 122, 123, . . .
x = no máximo 120= 0, 1, . . . 118, 119, 120
x = menos do que 120= 0, 1, . . . 118, 119
Slide 45
Ana M. Abreu - 2006/07
x = exactamente 120
Intervalo que representa o valor discreto 120
Slide 46
Ana M. Abreu - 2006/07
Distribuição t de Student
A distribuição t de Student é a designação de uma família de distribuições indexada pelo parâmetro νννν, que representa o número de graus de liberdade (g.l.).Reproduz-se em seguida parte da tabela desta distribuição.
Slide 47
Ana M. Abreu - 2006/07
Distribuição t de Studentαααα
νννν … .025 .01… …9 2.8214
10 2.7638
Os valores indicados escrevem-se na forma
t(0.01; 10) = 2.7638
e lê-se: o percentil 0.01 da distribuição t de Student com 10 graus de liberdade é 2.7638.
Slide 48
Ana M. Abreu - 2006/07
Distribuições t de Studentcom n = 3 e n = 12
Slide 49
Ana M. Abreu - 2006/07
Características importantes da distribuição t de Student
1. A distribuição t de Student varia de acordo com a dimensão da amostra (de acordo com a figura anterior, para os casos n = 3 e n = 12).
2. A curva da distribuição t de Student tem a mesma forma em sino da distribuição Normal, mas reflecte a maior variabilidade (com curvas mais alargadas) que é de esperar em amostras pequenas.
3. A distribuição t de Student tem valor médio zero (tal como a distribuição Normal standard).
4. O desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior do que 1 (o que não acontece com a distribuição Normal standard, onde σ σ σ σ = 1).
5. Quanto maior a dimensão da amostra, mais a distribuição tde Student se aproxima da distribuição Normal.
Slide 50
Ana M. Abreu - 2006/07
Distribuição Qui-quadrado
A distribuição Qui-quadrado é a designaçãode uma família de distribuições indexada pelo parâmetro νννν, que representa o númerode graus de liberdade (g.l.).Reproduz-se em seguida parte da tabela desta distribuição.
Slide 51
Ana M. Abreu - 2006/07
Distribuição Qui-quadrado
α (α (α (α (���������dade))))gl (df) … .10 .05
… …9 16.919
10 18.307
Os valores indicados escrevem-se na forma
ℵℵℵℵ2(0.05; 10) = 18.307
e lê-se: o percentil 0.05 da distribuição Qui-quadrado com 10 graus de liberdade é 18.307.
Slide 52
Ana M. Abreu - 2006/07
Características da distribuiçãoQui-Quadrado
1. A distribuição Qui-quadrado não é simétrica, ao contrário do que sucede com as distribuições Normal e t de Student.
Distribuição Qui-quadrado Distribuição Qui-quadrado para g.l.= 10 e g.l.= 20
À medida que o nº de graus de liberdade aumenta,,a distribuição torna-se mais simétrica.
Slide 53
Ana M. Abreu - 2006/07
Características da distribuiçãoQui-Quadrado
2. Os valores da distribuição Qui-quadrado podem ser positivos ou nulos, mas não podem ser negativos.
3. A distribuição Qui-quadrado é diferente consoante o nºde graus de liberdade, os quais se escrevem g.l.= n – 1. À medida que o nº de g.l. aumenta, a distribuição aproxima-se da distribuição Normal.