Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...

Post on 05-Feb-2018

218 views 0 download

Transcript of Capítulo 3 - Universidade da Madeiracee.uma.pt/edu/Estatistica07/teorica/Capitulo3.pdf · Cálculo...

Slide 1

Ana M. Abreu - 2006/07

Capítulo 3Modelos Estatísticos

Resenha

Variáveis Aleatórias

Distribuição Binomial

Distribuição de Poisson

Distribuição Normal

Distribuição t de Student

Distribuição Qui-quadrado

Slide 2

Ana M. Abreu - 2006/07

ResenhaEste capítulo aborda as

distribuições de probabilidade

tendo em conta os conhecimentos deestatistica descritiva apresentados no

Capítulo 1 e os de probabilidadeapresentados no Capítulo 2 .

As Distribuições de Probabilidade descrevem o que provavelmente acontecerá em vez de o

que realmente aconteceu.

Slide 3

Ana M. Abreu - 2006/07

Definiçõesv Uma variável aleatória é uma variável

(usualmente representada por X) que toma um certo valor numérico, determinado pelo acaso, de cada vez que a experiência érealizada.

v Uma distribução de probabilidade éum gráfico, tabela, ou fórmula que indicaa probabilidade correspondente a cadavalor da variável aleatória.

Slide 4

Ana M. Abreu - 2006/07

Definições

Uma variável aleatória discreta toma um nºfinito ou infinito numerável de valores.

Uma variável aleatória contínua toma um nºinfinito não numerável de valores, os quais podem ser associados com medidas numa escala contínua.

Slide 5

Ana M. Abreu - 2006/07

Propriedades das Distribuições de Probabilidade

P(x) = 1 onde x toma todos os valores possíveis.

Σ

0 ≤≤≤≤ P(x) ≤≤≤≤ 1 para qualquer valor de x.

Slide 6

Ana M. Abreu - 2006/07

Média, Variância e Desvio Padrão de uma Variável Aleatória

µ = ΣΣΣΣ [x • P(x)] Média

σσσσ2 = ΣΣΣΣ [(x – µ)2• P(x)] Variância

σσσσ2 = [ΣΣΣΣ x2

• P(x)] – µ2 Variância (forma reduzida)

σσσσ = ΣΣΣΣ [x 2• P(x)] – µ 2 Desvio Padrão

Slide 7

Ana M. Abreu - 2006/07

Definição

E = ΣΣΣΣ [x • P(x)]

O Valor Esperado de uma variável aleatória discreta é denotado por E, e representa a média dos resultados. Determina-se atravésdo valor de ΣΣΣΣ [x • P(x)].

Slide 8

Ana M. Abreu - 2006/07

Em resumo

Até agora aprendemos sobre:

v Combinar os métodos da estatística descritivacom os da probabilidade.

v Propriedades da distribuição de probabilidade.

v Média, variância e desvio padrão de uma variável aleatória.

v Variáveis aleatórias e distribuições de probabilidade.

v Valor esperado.

Slide 9

Ana M. Abreu - 2006/07

A Distribuição Binomial

Slide 10

Ana M. Abreu - 2006/07

Definições

A distribuição binomial verifica as seguintes condições:

1. A experiência tem um nº fixo de provas, n.

2. As provas são independentes. (O resultado de umaprova não afecta a probabilidade de ocorrência das restantes.)

3. Cada prova origina um de dois resultados possíveis: sucesso ou insucesso.

4. A probabilidade de sucesso, denotada por p, éconstante em cada prova.

Slide 11

Ana M. Abreu - 2006/07

Notação para a Distribuição Binomial

n denota o nº de provas (valor fixo à partida).

x denota um nº específico de sucessos em nprovas, logo x pode ser qualquer nº entre 0 e

n, inclusive.

p denota a probabilidade de sucesso em cada uma das n provas.

q denota a probabilidade de insucesso em cada uma das n provas.

P(x) denota a probabilidade de obter exactamente xsucessos em n provas (P(x)=P(X=x)).

Slide 12

Ana M. Abreu - 2006/07

Métodos para Determinaras Probabilidades com a

Distribuição Binomial

Vejamos três métodos possíveis para

determinar as probabilidades correspondentes

à variável aleatória X com distribuição binomial.

Slide 13

Ana M. Abreu - 2006/07

Método 1: Usando a Fórmula da Probabilidade na

Distribuição Binomial

P(X=x) = • px • qn-x(n – x)!x!

n !

para x = 0, 1, 2, . . ., nonde

n = nº de provas

x = nº de sucessos nas n provas

p = probabilidade de sucesso em cada prova

q = probabilidade de insucesso em cada prova (q = 1 – p)

Slide 14

Ana M. Abreu - 2006/07

Método 2: Usando uma Tabela de Probabilidades

Reproduz-se em baixo parte da tabela da binomial que

vamos usar. Com n = 5 e p = 0.2 na distribuição binomial,

as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são

0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373),

0.0512, 0.0064 e 0.0003, respectivamente.

n = 5 px .01 .05 .10 .200 .32771 .73732 .94213 .99334 .9997

Slide 15

Ana M. Abreu - 2006/07

Método 3:Usando a Tecnologia

Software Estatístico, Excel e algumas calculadoras

fornecem-nos as probabilidades da distribuição binomial.

Slide 16

Ana M. Abreu - 2006/07

Distribuição Binomial:Fórmulas

Desvio Padrão σσσσ = n • p • q

Média µ = n • p

Variância σσσσ 2 = n • p • q

onde

n = nº de provas

p = probabilidade de sucesso em cada uma das nprovas

q = probabilidade de insucesso em cada uma das nprovas

Slide 17

Ana M. Abreu - 2006/07

Esta situação pode ser resolvida através da distribuição binomial onde:

n = 14

p = 0.5q = 0.5

Usando as fórmulas da distribuição binomial, temos :

µ = (14)(0.5) = 7 raparigas

σσσσ = (14)(0.5)(0.5) = 1.871 raparigas

Exemplo

Determine a média e o desvio padrão para o nº de raparigas em 14 nascimentos.

Slide 18

Ana M. Abreu - 2006/07

Interpretação dos Resultados

Valores Máximos Usuais = µ + 2 σσσσValores Mínimos Usuais = µ – 2 σσσσ

É especialmente importante interpretar osresultados. Os valores dizem-se pouco usuaisse se encontrarem para além dos seguinteslimites:

Slide 19

Ana M. Abreu - 2006/07

Para esta distribuição binomial,

µ = 50 raparigas

σσσσ = 5 raparigas

µ + 2 σσσσ = 50 + 2(5) = 60µ - 2 σσσσ = 50 - 2(5) = 40

Em 100 nascimentos, é usual nascerem entre 40 e 60 raparigas. Assim, não é usual nascerem 68 raparigas.

Exemplo

Determine se é usual em 100 nascimentos, 68 serem raparigas.

Slide 20

Ana M. Abreu - 2006/07

A Distribuição de Poisson

Slide 21

Ana M. Abreu - 2006/07

Definição

A distribuição de Poisson é uma distribuição discreta que se aplica quando ocorre um acontecimento num intervalo especificado. A variável aleatória X representa o nº de ocorrências num determinado intervalo. O intervalo pode se referir a tempo, distância, área, volume, ou algum tipo de medida similar.

P(X=x)= onde e ≈≈≈≈ 2.71828µx • e

x!

Fórmula

Slide 22

Ana M. Abreu - 2006/07

Condições da Distribuição de Poisson

v A variável aleatória X designa o nº de acontecimentos nalgum intervalo. Assim, pode tomar quaisquer dos valores 0, 1, 2, …)

v Os acontecimentos têm que ser aleatórios.

v Os acontecimentos são independentes.

• Parâmetros

v A média é µ.

v O desvio padrão é σσσσ = µ .

Slide 23

Ana M. Abreu - 2006/07

Diferenças em relação àDistribuição Binomial

A distribuição de Poisson difere da distribuiçãobinomial nos seguintes aspectos fundamentais:

v A distribuição binomial é caracterizada peladimensão da amostra n e pela probabilidade de sucesso p, enquanto que a distribuição de Poisson é caracterizada apenas pela média µ.

v Numa distribuição binomial, os valores que a variável aleatória X pode tomar são 0, 1, . . . n, enquanto que na distribuição de Poisson a variávelX toma os valores 0, 1, . . . , sem limite superior.

Slide 24

Ana M. Abreu - 2006/07

Exemplo

Bombas da 2ª Guerra Mundial Em 1945 os alemãesbombardearam Londres com as bombas V2. A regiãolondrina está dividida em 576 distritos de superfíciessemelhantes, pelo que admitimos que cada distrito tem igual probabilidade de ser bombardeado. Calcula-se que o nº de bombas recebidas por Londres foi de 535.

Se um distrito for seleccionado ao acaso, determine a probabilidade de ter sido bombardeado com exactamente 2 bombas.

A distribuição de Poisson é adequada porque estamos a lidar com uma situação de ocorrência de acontecimentos (nº de bombas recebidas) num certo intervalo (distrito).

Slide 25

Ana M. Abreu - 2006/07

Exemplo

Assim, a probabilidade de um qualquer distrito ser atingido por exactamente 2 bombas é P(X=2) = 0.170.

O nº médio de bombas por distrito é

µ = 535 = 0.929576

Então, P(X=2) = 0.9292 e-0.929 = 0.170.2!

Slide 26

Ana M. Abreu - 2006/07

Cálculo da probabilidade na Distribuição de Poisson usando uma Tabela

Reproduz-se em baixo parte da tabela da distribuição de

Poisson que vamos usar. Com µ = 0.20, as probabilidades de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são

0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825),

0.001, e 0.0001, respectivamente.µ

x .05 .10 .15 .200 .81871 .98252 .99893 .99994 1.0000

Slide 27

Ana M. Abreu - 2006/07

Distribuição Normal

Slide 28

Ana M. Abreu - 2006/07

v Variável aleatória contínua

v Distribuição Normal

Caracterização

Figura 3-1

Fórmula 3-1

f(x) = σσσσ 2 ππππ

x-µµµµσσσσ

2( )e

-1

2

Slide 29

Ana M. Abreu - 2006/07

v Curva da Densidade (ou da função densidade de probabilidade) é o gráfico da distribuição de probabilidade de uma variável aleatória contínua.

Definições

1. A área total sob a curva é igual a 1.2. Todo o ponto sob a curva deve ter uma

ordenada de valor igual ou superior a zero.

Slide 30

Ana M. Abreu - 2006/07

Uso da Área para determinar a Probabilidade

Figura 3-2

Como a área total sob a curva é igual a 1, existe uma correspondência entre a área e a

probabilidade.

Slide 31

Ana M. Abreu - 2006/07

Alturas de Homens e Mulheres

Figura 3-3

Slide 32

Ana M. Abreu - 2006/07

DefiniçãoDistribuição Normal Standard :

a distribuição Normal que temmédia 0 e desvio padrão 1.

Figura 3-4

Slide 33

Ana M. Abreu - 2006/07

P(a < z < b) denota a probabilidade de z tomar valores entre

a e b

P(z > a)denota a probabilidade de z tomar valores maiores do

que a

P(z < a)denota a probabilidade de z tomar valores menores do

que a

Notação

Slide 34

Ana M. Abreu - 2006/07

Cálculo do valor de z correspondente a uma certa probabilidade

Figura 3-5Cálculo do Percentil 95

1.645

5% ou 0.05

(o valor de z será positivo)

Slide 35

Ana M. Abreu - 2006/07

Figura 3-6 Cálculo dos Percentis 2.5% e 97.5%

(Um dos valores de z será negativo e o outro positivo)

Cálculo do valor de z correspondente a uma certa probabilidade

Slide 36

Ana M. Abreu - 2006/07

Distribuições Normais não Standard

Se µµµµ ≠≠≠≠ 0 ou σ σ σ σ ≠≠≠≠ 1 (ou ambos), teremos que converter os valores usando a Fórmula 3-2; então, os procedimentos passam a ser os mesmos do que os usados com a distribuição Normal Standard.

Fórmula 3-2x – µσσσσz =

Slide 37

Ana M. Abreu - 2006/07

Figura 3-7

Conversão para a DistribuiçãoNormal Standard

x – µµµµσσσσz =

Slide 38

Ana M. Abreu - 2006/07

1. Não confunda valores de z com as correspondentes áreas. Os valores de z são distâncias ao longo do eixo horizontal enquanto que as áreas são regiões sob a curva da distribuição Normal. A tabela usada apresenta os valores de z na coluna à esquerda e na linha superior, enquanto que as áreas se encontram no “meio” da tabela.

2. Escolha o lado certo (direito/esquerdo) do gráfico.

3. Um valor de z deve ser negativo sempre que se encontre na metade esquerda da distribuição Normal.

4. As áreas (ou probabilidades) têm valores positivos ou nulos, mas nunca têm valores negativos.

Precauções a ter em conta

Slide 39

Ana M. Abreu - 2006/07

Cálculos usando a Tabela da distribuição Normal Standard

Seja Z a variável aleatória com distribuição Normal standard, ou seja, com valor médio zero e desvio padrão 1.Para calcular P(Z<0.32), é necessário consultar a tabela, na página referente aos valores positivos de z, como a seguir se indica:

z .00 .01 .020.0 .50800.1 .54780.2 .58710.3 .6255

Assim, P(Z<0.32)=0.6255.

Slide 40

Ana M. Abreu - 2006/07

Cálculos usando a Tabela da distribuição Normal Standard

De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se consultou a mesma tabela, embora na parte referente aos valores negativos de z.Por outro lado, para encontrar o valor de z correspondente a uma certa probabilidade, por exemplo, 0.975, o valor da probabilidade tem que ser procurado no interior da tabela para, só depois, determinar o valor de z que lhe corresponde.

z … .05 .06… …1.8 .96861.9 .9750

Assim, o valor de z correspondente à probabilidade 0.975 é1.96, ou seja, se P(Z<t)=0.975, então t=1.96.

Slide 41

Ana M. Abreu - 2006/07

Aproximação da Distribuição Binomial pela Distribuição Normal se:

np ≥≥≥≥ 5 e

nq ≥≥≥≥ 5

então µ = np e σσσσ = npq

e a variável aleatória tem uma

distribuição Normal

Slide 42

Ana M. Abreu - 2006/07

Procedimento para usar a Distribuição Normal para Aproximar a Distribuição

Binomial

1. Verifique que a distribuição Normal é uma aproximação adequada à distribuição Binomial confirmando que np ≥≥≥≥ 5 enq ≥≥≥≥ 5.

2. Determine os valores dos parâmetros µ e σσσσ calculando µ = np e σσσσ = npq.

3. Identifique o valor discreto de x (o nº de sucessos). Altere o valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5. Represente a curva da Normal e assinale os correspondentes valores de µ , σσσσ, e de x – 0.5 ou x + 0.5, conforme a situação.

4. Determine a área correspondente à probabilidade desejada.

Slide 43

Ana M. Abreu - 2006/07

Definição

Quando usamos a distribuição Normal (que é uma distribuição contínua) para

aproximar a distribuição Binomial (que éuma distribuição discreta), fazemos uma

correcção de continuidade ao valor discreto x na distribuição binomial

representando o valor x pelo intervalo de x – 0.5 a x + 0.5.

Slide 44

Ana M. Abreu - 2006/07

Figura 3-8

x = pelo menos 120= 120, 121, 122, . . .

x = mais do que 120= 121, 122, 123, . . .

x = no máximo 120= 0, 1, . . . 118, 119, 120

x = menos do que 120= 0, 1, . . . 118, 119

Slide 45

Ana M. Abreu - 2006/07

x = exactamente 120

Intervalo que representa o valor discreto 120

Slide 46

Ana M. Abreu - 2006/07

Distribuição t de Student

A distribuição t de Student é a designação de uma família de distribuições indexada pelo parâmetro νννν, que representa o número de graus de liberdade (g.l.).Reproduz-se em seguida parte da tabela desta distribuição.

Slide 47

Ana M. Abreu - 2006/07

Distribuição t de Studentαααα

νννν … .025 .01… …9 2.8214

10 2.7638

Os valores indicados escrevem-se na forma

t(0.01; 10) = 2.7638

e lê-se: o percentil 0.01 da distribuição t de Student com 10 graus de liberdade é 2.7638.

Slide 48

Ana M. Abreu - 2006/07

Distribuições t de Studentcom n = 3 e n = 12

Slide 49

Ana M. Abreu - 2006/07

Características importantes da distribuição t de Student

1. A distribuição t de Student varia de acordo com a dimensão da amostra (de acordo com a figura anterior, para os casos n = 3 e n = 12).

2. A curva da distribuição t de Student tem a mesma forma em sino da distribuição Normal, mas reflecte a maior variabilidade (com curvas mais alargadas) que é de esperar em amostras pequenas.

3. A distribuição t de Student tem valor médio zero (tal como a distribuição Normal standard).

4. O desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior do que 1 (o que não acontece com a distribuição Normal standard, onde σ σ σ σ = 1).

5. Quanto maior a dimensão da amostra, mais a distribuição tde Student se aproxima da distribuição Normal.

Slide 50

Ana M. Abreu - 2006/07

Distribuição Qui-quadrado

A distribuição Qui-quadrado é a designaçãode uma família de distribuições indexada pelo parâmetro νννν, que representa o númerode graus de liberdade (g.l.).Reproduz-se em seguida parte da tabela desta distribuição.

Slide 51

Ana M. Abreu - 2006/07

Distribuição Qui-quadrado

α (α (α (α (���������dade))))gl (df) … .10 .05

… …9 16.919

10 18.307

Os valores indicados escrevem-se na forma

ℵℵℵℵ2(0.05; 10) = 18.307

e lê-se: o percentil 0.05 da distribuição Qui-quadrado com 10 graus de liberdade é 18.307.

Slide 52

Ana M. Abreu - 2006/07

Características da distribuiçãoQui-Quadrado

1. A distribuição Qui-quadrado não é simétrica, ao contrário do que sucede com as distribuições Normal e t de Student.

Distribuição Qui-quadrado Distribuição Qui-quadrado para g.l.= 10 e g.l.= 20

À medida que o nº de graus de liberdade aumenta,,a distribuição torna-se mais simétrica.

Slide 53

Ana M. Abreu - 2006/07

Características da distribuiçãoQui-Quadrado

2. Os valores da distribuição Qui-quadrado podem ser positivos ou nulos, mas não podem ser negativos.

3. A distribuição Qui-quadrado é diferente consoante o nºde graus de liberdade, os quais se escrevem g.l.= n – 1. À medida que o nº de g.l. aumenta, a distribuição aproxima-se da distribuição Normal.