Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...

Ana M. Abreu - 2006/07

Capítulo 3Modelos Estatísticos

Resenha

Variáveis Aleatórias

Distribuição Binomial

Distribuição de Poisson

Distribuição Normal

Distribuição t de Student

Distribuição Qui-quadrado


ResenhaEste capítulo aborda as

distribuições de probabilidade

tendo em conta os conhecimentos deestatistica descritiva apresentados no

Capítulo 1 e os de probabilidadeapresentados no Capítulo 2 .

As Distribuições de Probabilidade descrevem o que provavelmente acontecerá em vez de o

que realmente aconteceu.


Definiçõesv Uma variável aleatória é uma variável

(usualmente representada por X) que toma um certo valor numérico, determinado pelo acaso, de cada vez que a experiência érealizada.

v Uma distribução de probabilidade éum gráfico, tabela, ou fórmula que indicaa probabilidade correspondente a cadavalor da variável aleatória.


Definições

Uma variável aleatória discreta toma um nºfinito ou infinito numerável de valores.

Uma variável aleatória contínua toma um nºinfinito não numerável de valores, os quais podem ser associados com medidas numa escala contínua.


Propriedades das Distribuições de Probabilidade

P(x) = 1 onde x toma todos os valores possíveis.

Σ

0 ≤≤≤≤ P(x) ≤≤≤≤ 1 para qualquer valor de x.


Média, Variância e Desvio Padrão de uma Variável Aleatória

µ = ΣΣΣΣ [x • P(x)] Média

σσσσ2 = ΣΣΣΣ [(x – µ)2• P(x)] Variância

σσσσ2 = [ΣΣΣΣ x2

• P(x)] – µ2 Variância (forma reduzida)

σσσσ = ΣΣΣΣ [x 2• P(x)] – µ 2 Desvio Padrão


Definição

E = ΣΣΣΣ [x • P(x)]

O Valor Esperado de uma variável aleatória discreta é denotado por E, e representa a média dos resultados. Determina-se atravésdo valor de ΣΣΣΣ [x • P(x)].


Em resumo

Até agora aprendemos sobre:

v Combinar os métodos da estatística descritivacom os da probabilidade.

v Propriedades da distribuição de probabilidade.

v Média, variância e desvio padrão de uma variável aleatória.

v Variáveis aleatórias e distribuições de probabilidade.

v Valor esperado.


A Distribuição Binomial


Definições

A distribuição binomial verifica as seguintes condições:

1. A experiência tem um nº fixo de provas, n.

2. As provas são independentes. (O resultado de umaprova não afecta a probabilidade de ocorrência das restantes.)

3. Cada prova origina um de dois resultados possíveis: sucesso ou insucesso.

4. A probabilidade de sucesso, denotada por p, éconstante em cada prova.


Notação para a Distribuição Binomial

n denota o nº de provas (valor fixo à partida).

x denota um nº específico de sucessos em nprovas, logo x pode ser qualquer nº entre 0 e

n, inclusive.

p denota a probabilidade de sucesso em cada uma das n provas.

q denota a probabilidade de insucesso em cada uma das n provas.

P(x) denota a probabilidade de obter exactamente xsucessos em n provas (P(x)=P(X=x)).


Métodos para Determinaras Probabilidades com a


Vejamos três métodos possíveis para

determinar as probabilidades correspondentes

à variável aleatória X com distribuição binomial.


Método 1: Usando a Fórmula da Probabilidade na


P(X=x) = • px • qn-x(n – x)!x!

n !

para x = 0, 1, 2, . . ., nonde

n = nº de provas

x = nº de sucessos nas n provas

p = probabilidade de sucesso em cada prova

q = probabilidade de insucesso em cada prova (q = 1 – p)


Método 2: Usando uma Tabela de Probabilidades

Reproduz-se em baixo parte da tabela da binomial que

vamos usar. Com n = 5 e p = 0.2 na distribuição binomial,

as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são

0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373),

0.0512, 0.0064 e 0.0003, respectivamente.

n = 5 px .01 .05 .10 .200 .32771 .73732 .94213 .99334 .9997


Método 3:Usando a Tecnologia

Software Estatístico, Excel e algumas calculadoras

fornecem-nos as probabilidades da distribuição binomial.


Distribuição Binomial:Fórmulas

Desvio Padrão σσσσ = n • p • q

Média µ = n • p

Variância σσσσ 2 = n • p • q

onde

n = nº de provas

p = probabilidade de sucesso em cada uma das nprovas

q = probabilidade de insucesso em cada uma das nprovas


Esta situação pode ser resolvida através da distribuição binomial onde:

n = 14

p = 0.5q = 0.5

Usando as fórmulas da distribuição binomial, temos :

µ = (14)(0.5) = 7 raparigas

σσσσ = (14)(0.5)(0.5) = 1.871 raparigas

Exemplo

Determine a média e o desvio padrão para o nº de raparigas em 14 nascimentos.


Interpretação dos Resultados

Valores Máximos Usuais = µ + 2 σσσσValores Mínimos Usuais = µ – 2 σσσσ

É especialmente importante interpretar osresultados. Os valores dizem-se pouco usuaisse se encontrarem para além dos seguinteslimites:


Para esta distribuição binomial,

µ = 50 raparigas

σσσσ = 5 raparigas

µ + 2 σσσσ = 50 + 2(5) = 60µ - 2 σσσσ = 50 - 2(5) = 40

Em 100 nascimentos, é usual nascerem entre 40 e 60 raparigas. Assim, não é usual nascerem 68 raparigas.

Exemplo

Determine se é usual em 100 nascimentos, 68 serem raparigas.


A Distribuição de Poisson


Definição

A distribuição de Poisson é uma distribuição discreta que se aplica quando ocorre um acontecimento num intervalo especificado. A variável aleatória X representa o nº de ocorrências num determinado intervalo. O intervalo pode se referir a tempo, distância, área, volume, ou algum tipo de medida similar.

P(X=x)= onde e ≈≈≈≈ 2.71828µx • e

-µ

x!

Fórmula


Condições da Distribuição de Poisson

v A variável aleatória X designa o nº de acontecimentos nalgum intervalo. Assim, pode tomar quaisquer dos valores 0, 1, 2, …)

v Os acontecimentos têm que ser aleatórios.

v Os acontecimentos são independentes.

• Parâmetros

v A média é µ.

v O desvio padrão é σσσσ = µ .


Diferenças em relação àDistribuição Binomial

A distribuição de Poisson difere da distribuiçãobinomial nos seguintes aspectos fundamentais:

v A distribuição binomial é caracterizada peladimensão da amostra n e pela probabilidade de sucesso p, enquanto que a distribuição de Poisson é caracterizada apenas pela média µ.

v Numa distribuição binomial, os valores que a variável aleatória X pode tomar são 0, 1, . . . n, enquanto que na distribuição de Poisson a variávelX toma os valores 0, 1, . . . , sem limite superior.


Exemplo

Bombas da 2ª Guerra Mundial Em 1945 os alemãesbombardearam Londres com as bombas V2. A regiãolondrina está dividida em 576 distritos de superfíciessemelhantes, pelo que admitimos que cada distrito tem igual probabilidade de ser bombardeado. Calcula-se que o nº de bombas recebidas por Londres foi de 535.

Se um distrito for seleccionado ao acaso, determine a probabilidade de ter sido bombardeado com exactamente 2 bombas.

A distribuição de Poisson é adequada porque estamos a lidar com uma situação de ocorrência de acontecimentos (nº de bombas recebidas) num certo intervalo (distrito).


Exemplo

Assim, a probabilidade de um qualquer distrito ser atingido por exactamente 2 bombas é P(X=2) = 0.170.

O nº médio de bombas por distrito é

µ = 535 = 0.929576

Então, P(X=2) = 0.9292 e-0.929 = 0.170.2!


Cálculo da probabilidade na Distribuição de Poisson usando uma Tabela

Reproduz-se em baixo parte da tabela da distribuição de

Poisson que vamos usar. Com µ = 0.20, as probabilidades de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são

0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825),

0.001, e 0.0001, respectivamente.µ

x .05 .10 .15 .200 .81871 .98252 .99893 .99994 1.0000


Distribuição Normal


v Variável aleatória contínua

v Distribuição Normal

Caracterização

Figura 3-1

Fórmula 3-1

f(x) = σσσσ 2 ππππ

x-µµµµσσσσ

2( )e

-1

2


v Curva da Densidade (ou da função densidade de probabilidade) é o gráfico da distribuição de probabilidade de uma variável aleatória contínua.

Definições

1. A área total sob a curva é igual a 1.2. Todo o ponto sob a curva deve ter uma

ordenada de valor igual ou superior a zero.


Uso da Área para determinar a Probabilidade

Figura 3-2

Como a área total sob a curva é igual a 1, existe uma correspondência entre a área e a

probabilidade.


Alturas de Homens e Mulheres

Figura 3-3


DefiniçãoDistribuição Normal Standard :

a distribuição Normal que temmédia 0 e desvio padrão 1.

Figura 3-4


P(a < z < b) denota a probabilidade de z tomar valores entre

a e b

P(z > a)denota a probabilidade de z tomar valores maiores do

que a

P(z < a)denota a probabilidade de z tomar valores menores do

que a

Notação


Cálculo do valor de z correspondente a uma certa probabilidade

Figura 3-5Cálculo do Percentil 95

1.645

5% ou 0.05

(o valor de z será positivo)


Figura 3-6 Cálculo dos Percentis 2.5% e 97.5%

(Um dos valores de z será negativo e o outro positivo)

Cálculo do valor de z correspondente a uma certa probabilidade


Distribuições Normais não Standard

Se µµµµ ≠≠≠≠ 0 ou σ σ σ σ ≠≠≠≠ 1 (ou ambos), teremos que converter os valores usando a Fórmula 3-2; então, os procedimentos passam a ser os mesmos do que os usados com a distribuição Normal Standard.

Fórmula 3-2x – µσσσσz =


Figura 3-7

Conversão para a DistribuiçãoNormal Standard

x – µµµµσσσσz =


1. Não confunda valores de z com as correspondentes áreas. Os valores de z são distâncias ao longo do eixo horizontal enquanto que as áreas são regiões sob a curva da distribuição Normal. A tabela usada apresenta os valores de z na coluna à esquerda e na linha superior, enquanto que as áreas se encontram no “meio” da tabela.

2. Escolha o lado certo (direito/esquerdo) do gráfico.

3. Um valor de z deve ser negativo sempre que se encontre na metade esquerda da distribuição Normal.

4. As áreas (ou probabilidades) têm valores positivos ou nulos, mas nunca têm valores negativos.

Precauções a ter em conta


Cálculos usando a Tabela da distribuição Normal Standard

Seja Z a variável aleatória com distribuição Normal standard, ou seja, com valor médio zero e desvio padrão 1.Para calcular P(Z<0.32), é necessário consultar a tabela, na página referente aos valores positivos de z, como a seguir se indica:

z .00 .01 .020.0 .50800.1 .54780.2 .58710.3 .6255

Assim, P(Z<0.32)=0.6255.


Cálculos usando a Tabela da distribuição Normal Standard

De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se consultou a mesma tabela, embora na parte referente aos valores negativos de z.Por outro lado, para encontrar o valor de z correspondente a uma certa probabilidade, por exemplo, 0.975, o valor da probabilidade tem que ser procurado no interior da tabela para, só depois, determinar o valor de z que lhe corresponde.

z … .05 .06… …1.8 .96861.9 .9750

Assim, o valor de z correspondente à probabilidade 0.975 é1.96, ou seja, se P(Z<t)=0.975, então t=1.96.


Aproximação da Distribuição Binomial pela Distribuição Normal se:

np ≥≥≥≥ 5 e

nq ≥≥≥≥ 5

então µ = np e σσσσ = npq

e a variável aleatória tem uma

distribuição Normal


Procedimento para usar a Distribuição Normal para Aproximar a Distribuição

Binomial

1. Verifique que a distribuição Normal é uma aproximação adequada à distribuição Binomial confirmando que np ≥≥≥≥ 5 enq ≥≥≥≥ 5.

2. Determine os valores dos parâmetros µ e σσσσ calculando µ = np e σσσσ = npq.

3. Identifique o valor discreto de x (o nº de sucessos). Altere o valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5. Represente a curva da Normal e assinale os correspondentes valores de µ , σσσσ, e de x – 0.5 ou x + 0.5, conforme a situação.

4. Determine a área correspondente à probabilidade desejada.


Definição

Quando usamos a distribuição Normal (que é uma distribuição contínua) para

aproximar a distribuição Binomial (que éuma distribuição discreta), fazemos uma

correcção de continuidade ao valor discreto x na distribuição binomial

representando o valor x pelo intervalo de x – 0.5 a x + 0.5.


Figura 3-8

x = pelo menos 120= 120, 121, 122, . . .

x = mais do que 120= 121, 122, 123, . . .

x = no máximo 120= 0, 1, . . . 118, 119, 120

x = menos do que 120= 0, 1, . . . 118, 119


x = exactamente 120

Intervalo que representa o valor discreto 120


Distribuição t de Student

A distribuição t de Student é a designação de uma família de distribuições indexada pelo parâmetro νννν, que representa o número de graus de liberdade (g.l.).Reproduz-se em seguida parte da tabela desta distribuição.


Distribuição t de Studentαααα

νννν … .025 .01… …9 2.8214

10 2.7638

Os valores indicados escrevem-se na forma

t(0.01; 10) = 2.7638

e lê-se: o percentil 0.01 da distribuição t de Student com 10 graus de liberdade é 2.7638.


Distribuições t de Studentcom n = 3 e n = 12


Características importantes da distribuição t de Student

1. A distribuição t de Student varia de acordo com a dimensão da amostra (de acordo com a figura anterior, para os casos n = 3 e n = 12).

2. A curva da distribuição t de Student tem a mesma forma em sino da distribuição Normal, mas reflecte a maior variabilidade (com curvas mais alargadas) que é de esperar em amostras pequenas.

3. A distribuição t de Student tem valor médio zero (tal como a distribuição Normal standard).

4. O desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior do que 1 (o que não acontece com a distribuição Normal standard, onde σ σ σ σ = 1).

5. Quanto maior a dimensão da amostra, mais a distribuição tde Student se aproxima da distribuição Normal.



A distribuição Qui-quadrado é a designaçãode uma família de distribuições indexada pelo parâmetro νννν, que representa o númerode graus de liberdade (g.l.).Reproduz-se em seguida parte da tabela desta distribuição.



α (α (α (α (��dade))))gl (df) … .10 .05

… …9 16.919

10 18.307

Os valores indicados escrevem-se na forma

ℵℵℵℵ2(0.05; 10) = 18.307

e lê-se: o percentil 0.05 da distribuição Qui-quadrado com 10 graus de liberdade é 18.307.


Características da distribuiçãoQui-Quadrado

1. A distribuição Qui-quadrado não é simétrica, ao contrário do que sucede com as distribuições Normal e t de Student.

Distribuição Qui-quadrado Distribuição Qui-quadrado para g.l.= 10 e g.l.= 20

À medida que o nº de graus de liberdade aumenta,,a distribuição torna-se mais simétrica.


Características da distribuiçãoQui-Quadrado

2. Os valores da distribuição Qui-quadrado podem ser positivos ou nulos, mas não podem ser negativos.

3. A distribuição Qui-quadrado é diferente consoante o nºde graus de liberdade, os quais se escrevem g.l.= n – 1. À medida que o nº de g.l. aumenta, a distribuição aproxima-se da distribuição Normal.

Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...

Documents

Transcript of Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...