Método de se inferir sobre uma população a partir do...

13
1 Prof. Lorí Viali, Dr. [email protected] http://www.ufrgs.br/~viali/ Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística Uma coleção de todos os possíveis elementos, objetos ou medidas de interesse. Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística Um levantamento efetuado sobre toda uma população é denominado de levantamento censitário ou simplesmente censo. Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística Um subconjunto finito de uma população de interesse. Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística O processo de escolha de uma amostra da população é denominado de amostragem. Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística Método de se inferir sobre uma população a partir do conhecimento de pelo menos uma amostra dessa população.

Transcript of Método de se inferir sobre uma população a partir do...

11

Prof. Lorí Viali, [email protected]

http://www.ufrgs.br/~viali/Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma coleção de todos os

possíveis elementos, objetos

ou medidas de interesse.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um levantamento efetuado

sobre toda uma população é

denominado de levantamento censitário ou simplesmente

censo.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um subconjunto finito

de uma população de

interesse.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O processo de escolha de

uma amostra da população é

denominado de amostragem.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Método de se inferir sobre

uma população a partir do

conhecimento de pelo menos

uma amostra dessa população.

22

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Estudo das relações teóricas

existentes entre uma população e

as amostras dela extraídas.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

POPULAÇÃO(Censo)

AMOSTRA(Amostragem)

InferênciaErro

PROBABILIDADE

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

AT m i op so ts r

ad g e e

m

Probabilística

Não Probabilística

Todos os elementos da

população têm probabilidade conhecida (e diferente de zero)

de fazer parte da amostra.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Aleatória Simples

Sistemática

Estratificada

Por Conglomerados

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma amostra é dita “aleatória

simples” ou “ao acaso” se todos os

elementos da população tiverem a

mesma probabilidade de pertencer a

amostra

33

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A

A

S

====

n

Nk

AnNk =

ComReposição

SemReposição

Total de Amostras

Nnk =

Não Ordenadas

Ordenadas

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A unidade amostral é escolhida

em intervalos pré-fixados. Assim se

N = tamanho da população e

n = tamanho da amostra. Então o

passo ou intervalo é k = N/n.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se N = 1000 e n = 100

Então:

k = N/n = 1000/100= 10.

Sorteia-se um número entre 1 e 10.

Digamos 7. Então a amostra será:

7, 17, 27, ...., 997.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A população é estratificada

(em grupos mutuamente

exclusivos) e então uma amostra

aleatória simples de cada estrato

é retirada.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Nos métodos anteriores cada

observação é escolhida de forma

individual. Na amostragem por

agrupamento, grupos de

observações são escolhidas ao

acaso.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Considere uma população de

20 itens dividida em 5 grupos de 4

itens cada. Para escolher uma

amostra de n = 8, escolhe-se 2 grupos, ao invés de 8 itens

individuais.

44

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Grupo Elementos

1 X1, X2, X3, X4

2 X5, X6, X7, X8

3 X9, X10, X11, X12

4 X13, X14, X15, X16

5 X17, X18, X19, X20

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma característica da população é denominada de parâmetro.

Um estimador é uma

característica da amostra.

Uma estimativa é um valor

particular de um estimador.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A MÉDIAµ

A VARIÂNCIAσ2

O DESVIO PADRÃOσ

A PROPORÇÃOπProf. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A VARIÂNCIAS2

O DESVIO PADRÃOS

A PROPORÇÃOP

A MÉDIAX

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

POPULAPOPULAÇÇÃOÃO

θθθθ

θ̂1

θ̂2

θ̂k

..... ....................... ..................

Amostra 1

Amostra 2

Amostra k

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A distribuição de

probabilidade de um

estimador (variável aleatória)

é denominada de distribuição

amostral desse estimador.

55

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

População P = {1, 2, 3, 4}

%504

2

4

1010==

+++=π

2514

30502

222

2 ,n

,X =−=−= µ∑

σ

5024

10

4

4321,==

+++=µ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0,00

0,05

0,10

0,15

0,20

0,25

1 2 3 4

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Plano Amostral

aa = ao acaso

Método

s/r = sem reposição

Tamanho das Amostras

n = 2

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

N = 4; n = 2.

Então:

6242

4

2

4=

−=

=

=

)!(!

!

n

Nk

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0,50,53,5(3, 4)6

1,02,03,0(2, 4)5

0,50,52,5(2, 3) 4

0,54,52,5(1, 4)3

0,02,02,0(1, 3)2

0,50,51,5(1, 2)1

ProporçõesVariânciasMédiasAmostras

66

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

1/63,5

1,0Total

1/63,0

2/62,5

1/62,0

1/61,5

x )xX(P)x(f ==

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

1,5 2,0 2,5 3,0 3,5

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

15/63,5/6

3,0/6

5,0/6

2,0/6

1,5/6

1,01/6

1/6

2/6

1/6

1/6

12,25/63,5

40/6Total

9,00/63,0

12,50/62,5

4,00/62,0

2,25/61,5

x )x(f )x(f.x )x(f.x2

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

502615 ,/

)x(f.x)X(EX

==

=== ∑µ

3

251

6

40502

2

222

,

)(E)X(V

,

)X(EXX

=−=

=−==σ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Média

Erro padrão

COMReposição

SEMReposição

Características

nX

σ=σ

1−

−σ=σ

NnN

nX

µ==µ )X(EX

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para este exemplo, tem-se:

3

25,1

3

2

2

25,1

14

24

2

25,1

1N

nN

n

22

X

=

=

=

−=

−= σ

σ

77

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se uma amostra aleatória de

tamanho “n” for retirada de uma

população X com uma distribuição

N(µ; σ), então a distribuição de ,

média da amostra, tem uma

distribuição N(µ, )

X

n

σ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Médias

População 14

2

nX ==

σ=σ

2=σ

µ=µX

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma amostra de n = 16

elementos é retirada de uma

população N(80; 8). Determine:

)77X(P )a( <

)85X76(P )b( << 0,00

0,04

0,08

0,12

0,16

0,20

48 56 64 72 80 88 96 104 112

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se: µ = 80, σ = 8

Sabe-se que:

216

8

n

e 80

X

X

==σ

=

=

σ

µ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

%68,6 0,0668

)50,1(-1,50)P(Z

)2

8077X(P

)77X(P )a(

X

X

==

=−Φ=<=

=−

<−

=

=<

σ

µ

88

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

%10,97%28,2%38,99

)00,2()50,2(

)5,2Z2(P

)2

8085X

2

8076(P

)85X76(P )b(

X

X

=−=

=Φ−Φ=

=<<−=

=−

<−

<−

=

=<<

σ

µ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se uma amostra aleatória de

tamanho “n > 30” for retirada de uma

população com qualquer distribuição

de média µ e desvio padrão σ, então a

distribuição de , média da amostra,

tem uma distribuição aproximadamente

N(µ, )

X

n

σ

0,00

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0 2 4 6 8

Médias

População50

16

2,

nX ==

σ=σ

2=σ

2=µ=µXProf. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma amostra de “n” elementos é

retirada de uma população N(80; 4).

Determine “n” de forma que:

%,)X(P 50179 =<

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se: µ = 80, σ = 4

Sabe-se que:

nn

e

X

X

4

80

=

=

σ

µ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

%,)4

n()

4

n-P(Z

)

n

X(P

)X(P

X

X

501

4

8079

79

=−Φ=<=

=−

<−

=

=<

σ

µ

99

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

76

6884172

1724

6882

≅≥

==

−=−

),(n

,.,n

,n

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

1,0Total1/61,0

3/60,5

1/60,0

f(p)p

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0,00

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0 0,5 1

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

3/61/6

2/6

0/6

p.f(p)

1,01/6

4/6

1/6

f(p)

1/61,0

2/6Total

1/60,5

0/60,0

p2.f(p)p

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

%5050,06/3

)p(f.p)P(EP

===

=== ∑µ

12

1

6

2

)(E)P(V

6

3

)P(EP

2

222P

=−=

=−==

σ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

COMReposição

SEMReposição

Média

Erro padrão

π==µ )P(EP

1N

nN

n

)1(P

−π−π=σ

n

)1(P

π−π=σ

Características

1010

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para este exemplo, tem-se:

12

1

3

25,0

3

2

2

25,0

14

24

2

5,0.5,0

1N

nN

n

)1(2P

==

=

=

−=

−π−π=σ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

0,0 25,0 50,0 75,0 100,0

%50

0,5.0,5

)1(P

=

==

=π−π=σ

%81,1510

)50,01(5,0n

)1(P ====

−−−−====

ππππ−−−−ππππ====σσσσ

%50P

=π=µ

População

Médias

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se uma amostra aleatória de

tamanho “n > 100” for retirada de uma

população com proporção ππππ, então a

distribuição de P, proporção na

amostra, tem uma distribuição

aproximadamente N(π, )n

( π−π 1 0,00

0,01

0,02

0,03

0,04

0,05

40,00 42,50 45,00 47,50 50,00 52,50 55,00 57,50 60,00

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma amostra de n = 400 eleitores

é retirada da população que prefere o

candidato Zigoto com π = 50%

Determine:

%)56P(P )b( >

%)54P%47(P )a( <<

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se: π = 50%

Sabe-se que: µP = π = 50%

%50,2025,0

400

)45,01(45,0

n

)1(P

==

=−

=

=π−π

1111

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

%01,83

%51,11%52,94)20,1( - )60,1(

1,60) Z P(-1,20

)%5,2

%50%54P

%5,2

%50%47(P

)54P47(P )a(

P

P

=

=−=−ΦΦ=

=<<=

=−

<−

<−

=

=<<

σ

µ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

%82,0)40,2(

)40,2(1)40,2Z(P

)%50,2

%50%56P(P

%)56P(P )b(

P

P

=−Φ=

=Φ−=>=

−>

−=

=>

σ

µ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

1,0Total1/64,5

2/62,0

3/60,5

f(s2)s2

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,5 2,0 4,5

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

10/64,5/6

4,0/6

1,5/6

s2.f(s2)

1,01/6

2/6

3/6

f(s2)

20,25/64,5

29/6Total

8,00/62,0

0,75/60,5

(s2) 2.f(s2)s2

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

67,13

5

)(f)(E ssS222

S2

==

=== ∑µ

06,218

37

18

5087

6

29

][E)(V

3

5

)S(E)S(S

2

2 22 222

S2

==−

=−=

=−==

σ

1212

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Média

Erro padrão

CaracterísticasAmostragem com reposição

)(E 22

S2 S σµ ==

1n

2

1n

2 24

S2−

=−

= σσ

σ

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se uma amostra aleatória de

tamanho “n” (grande) for retirada de

uma população com variância σσσσ2222, então

a distribuição de S2, variância da amostra, tem uma distribuição

aproximadamente χ2 com “n-1” g.l., a

menos de uma constante.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Isto é:

χσ−

=2

1-nnS

1

22

Este resultado é conhecido como Teorema de Fisher

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma amostra de n = 81

elementos é retirada de uma

população com variância σσσσ2 = 10.

Determine a probabilidade de que

P(S2 > 15).

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

n = 81

σ2 = 10

Sabe-se que:

χσ−

=2

1-nnS

1

22

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

%,)

)).

)).

])n.(

])n(

[P)(P

(P

(P(P

[P

S

n

n

250120

10

8015

10

8015

115

151

15

2

80

2

80

2

80

2

2

1

2

1

22

=>

=>=>=

=−

>=

=>−

=>

χ

χχ

σχ

χσ

Então:

1313

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0,00

0,02

0,04

0,06

0,08

35 38 40 43 45 48 50 53 55 58 60 63 65

)5 ; 50(N

0%

10%

20%

30%

40%

50%

10 19 29 39 49 58 68 78 87 97 107 117 126 136 146

25)(E 22S == σ

35,351n

2 = 2

S2 =−

σσ

Mínimo Máximo Média Desvio (Erro) Padrão

0,0085 110,2515 22,0809 25,76778

n = 2

0%

5%

10%

15%

20%

6 13 19 25 31 37 43 49 55 61 67 73 79 85 91

252

S2 == σµ

68,174

2.25

1n

2 = 2

S2 ==−

σσn = 5

Mínimo Máximo Média Desvio (Erro) Padrão

3,54 113,22 26,80 20,37

0%

5%

10%

15%

20%

12 14 17 19 22 24 27 29 32 34 37 39 41 44 46

252

S2 == σµ

07,725

2.25

1n

2 = 2

S2

==

=−

σσn = 25

Mínimo Máximo Média Desvio (Erro) Padrão

12,94 39,90 25,66 6,28