Estatística Aplica à Educação Físcia
Profa. Dra. Maria Ivanilde S. Araú[email protected]
Inferência Estatística
Intervalo de ConfiançaTeste de Hipótese
Inferência Estatística
Consiste em um conjunto de procedimentos para o estabelecimento de conclusões e tomada de decisões sobre a população, baseados nas informações amostrais
A inferência estatística é o processo pelo qual informações a cerca da população são obtidas a partir de dados de uma determinada amostra.
Inferência Estatística
Esta técnica é dividida em:
• Estimação de parâmetros e
• Teste de Hipóteses.
Conceitos
ParâmetroÉ uma medida numérica que descreve alguma característica de uma população.
EstatísticaÉ uma função das observações amostrais, que não depende de parâmetros desconhecidos.
Conceitos
EstimaçãoEstudo de métodos para obter medidas representativas da população calculadas a partir da amostra.
Estimador É a função da amostra que corresponde a um parâmetro populacional.
EstimativaÉ o valor do estimador, calculado a partir de uma amostra.
População: Média = µ
Variância = σ²
Proporção = π
Amostra: Média = estimador de µ
Variância = S² estimador de σ²
Proporção = p estimador de π
X
Tipos de estimação de ParâmetrosUm parâmetro pode ser estimado de duas formas: por ponto ou por intervalo
Estimativa PontualÉ o valor que o estimador assume para uma determinada amostra.
Estimativa Intervalar
É o intervalo definido pela estimativa pontual mais/menos o erro máximo da estimativa.
Distribuição Amostral
A distribuição que descreve o padrão de variação dos valores de uma estatística, para diferentes amostras extraídas da população de interesse, é denominada distribuição amostral.
Amostra Aleatória
As observações x1, x2, ..., xn constituem uma amostra aleatória de tamanho n da população, se cada observação resulta de seleções independentes dos elementos da população e se cada xi tem a mesma distribuição da população da qual foi extraída.
Distribuição da Média Amostral
A distribuição da média amostral , de uma amostra aleatória de tamanho n extraída de uma população que tem média μ e desvio padrão σ, tem as seguintes características:
Média =
Variância =
Desvio Padrão =
X
xXE
n
XVAR x
22
n
XDP x
Distribuição da Média Amostral
A distribuição da média amostral , de uma amostra aleatória de tamanho n extraída de uma POPULAÇÃO NORMAL que tem média μ e desvio padrão σ, é NORMAL com média μ e desvio padrão .
X
n
Teorema Central do Limite
A distribuição da média amostral , de uma amostra aleatória de tamanho n extraída de uma população NÃO NORMAL, com média μ e desvio padrão σ, é APROXIMADAMENTE NORMAL com média μ e desvio padrão .
Este resultado significa que:
é aproximadamente N(0, 1).
n
X
n
XZ
Estimativas de Médias
Quando calculamos a média de uma amostra, na realidade estamos determinando a estimativa da média populacional.
σ é o desvio padrão
n.e Z
2
Erro Máximo da Estimativa
Representa a diferença (erro) máxima que será permitida entre a estimativa pontual ( ) e o valor verdadeiro do parâmetro que está sendo estudado (μ).
1 -
n
SZ 2
.
2 2
X
Erro Cometido na Estimação de μ por , segundo Montgomery, D.C. & Runger, G.C. (1994).
*
XErro
nZXI
2
nZXS 2
X
X
Intervalo de Confiança
Dado a limitação da estimação pontual, que reside no desconhecimento da magnitude do erro que se está cometendo, surge a idéia da construção de um intervalo que contenha, com um nível de confiança conhecido, o valor verdadeiro do parâmetro. Este intervalo é baseado na distribuição amostral do estimador pontual.
Intervalo de Confiança
n X(µ, σ²)
População
X
x 96,1 x 96,1xX 96,11
xX 96,12
xkX 96,1
1X
2X
kX
µ
n
n
amostra
amostra
amostra
95% dos intervalosContêm µ
Relação entre o Coeficiente de Confiança e o Comprimento do Intervalo de Confiança para a Média Populacional μ, segundo Neter; J., Wasserman, W. & Whitmore, G. A (1993).
Comprimento do Intervalo de Confiança
Coeficiente de Confiança
99,9%
95%
90%
80%
70%
60%
50%
eX
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) conhecida
nzX
nzX
..
22
Podemos afirmar com (1 – α )100% de confiança que o intervalo de , contém a média populacional que estamos procurando estimar;
O grau de confiança mais utilizado é 95% e o valor correspondente Zα/2 é 1,96;
O intervalo de confiança é definido pelo grau de confiança e pela variabilidade.
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) conhecida
Exemplo: Para uma amostra de 50 observações de uma população normal com média desconhecida e desvio padrão σ = 6, seja 20,5 a média amostral . Construir um intervalo de 95% de confiança para a média populacional.
X
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) conhecida
= 20,5; n = 50; σ = 6
O resultado obtido [18,84; 22,16] é um intervalo de confiança de 95% de confiança para a média populacional μ, calculado com base na amostra observada.
16,22;84,1850
696,15,20;
50
696,15,20
X
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida
Se x1, x2, ..., xn é uma amostra aleatória de uma população normal com média μ e desvio padrão σ, então a distribuição de
é denominada distribuição t de Student com n – 1 graus de liberdade
nS
Xt
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida
n
StX
n
StX nn ..
2;12;1
( n ≤ 30) Neste caso precisa-se calcular a
estimativa S (desvio padrão amostral) a partir dos dados;
O coeficiente t segue a distribuição "t" de Student, no caso com (n – 1) graus de liberdade.
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida
Colete uma amostra de tamanho n ≤ 30 da população de interesse;
Calcule os valores de e S;Escolha o valor do coeficiente de confiança 1 – α ;
Determine os valores de tα/2; n – 1 a partir da tabela da distribuição t de Student;
Calcule os limites do intervalo de confiança.
X
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida
Exemplo: Uma amostra de tamanho 9, extraída de uma população normal acusa = 1,0 e S = 0,264. Construir intervalos de 98% e 95% de confiança para média populacional.
X
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida
Para 1 – α = 98% α = 0,02; α/2 = 0,01 graus de liberdade = 9 – 1 = 8.
Intervalo:
[1 2,896(0,264/3)] [0,745; 1,255]
nStX 8;01,0
Intervalo de Confiança para Média (µ)Para Variância pop. (σ² ) desconhecida
Para 1 – α = 95% α = 0,05; α/2 = 0,025 graus de liberdade = 9 – 1 = 8.
Intervalo:
[1 2,306(0,264/3)] [0,797; 1,203].Note que, aumentando o nível de confiança, o tamanho do intervalo também aumenta.
nStX 8;025,0
Tamanho da Amostra para Estimar a Média
Para se ter 100(1 – α )% de confiança de que o erro de estimação seja inferior a um valor predeterminado e, o tamanho da amostra necessário é:
X
22
e
Zn
Etapas para determinação do tamanho da amostra necessária para estimação da média populacional μ
Especificar o coeficiente de confiança 1 – α;
Obter uma estimativa preliminar do desvio padrão σ;
Especificar o erro máximo e permitido na estimação;
Obter o valor de Zα/2 da distribuição normal;
24686,245)5,0(
16)96,1(2
2
nn
Exemplo: Suponha que desejamos estimar uma média populacional com erro amostral 0,5 e probabilidade de confiança 0,95. Como 2 (variância populacional) não é conhecida, foi retirada uma amostra de 10 observações da população para nos dar uma ideia sobre valor de 2, obteve-se S2 = 16. Determine o tamanho da amostra necessário para atender estas especificações.
Tamanho da Amostra para Estimar a Média
Estimativa de Proporções
Suponha que há interesse na proporção de elementos da população que possuem alguma característica de interesse (p).
Se o tamanho da amostra (n) for suficientemente grande, é possível fazer mensurações para: Intervalo de Confiança; Teste de Hipótese.
Intervalo de Confiança para p
n
)p̂1(p̂p̂p
n
)p̂1(p̂p̂ zz
22
Intervalo de Confiança para p
Colete uma amostra de tamanho n da população de interesse;
Determine o valor de y;Onde y = nº de elementos na amostra que possuem a característica de interesse;
Calcule ;Escolha o valor do coeficiente de confiança 1 – α ;Determine os valores de Zα/2 a partir da distribuição
normal; Calcule os limites do intervalo de confiança.
n
yp̂
Intervalo de Confiança para p
Exemplo: Entrevistam em uma cidade 1.500 pessoas em idade de trabalho, e constata-se que 145 estão desempregadas.
1) Estimar a taxa de desempregado com base nos dados,
2) Estabelecer um intervalo de 95% de confiança para a taxa populacional.
Intervalo de Confiança para p
1)
2) α = 0,05; α/2 = 0,025; Z0,025 = 1,96.
= [0,097 0,0149] = [0,082; 0,112]
= [8,2%; 11,2%].Assim um intervalo de confiança a 95% para p (proporção de pessoas desempregadas na população) é dado por (0,082; 0,112).
%7,9097,01500
145p̂
1500)097,01(097,096,1097,0
2
2
2
e
p1pn Z )(
Tamanho da Amostra para Estimar p
n
p1pe z 2
)(
Par que seja possível ter 100(1 – α)% de confiança que o erro de estimação é inferior a um valor predeterminado e, o tamanho da amostra necessário é:
onde erro máximo da estimativa é dado a partir de,
pp ˆ
Etapas para determinação do tamanho da amostra necessária para estimação da proporção p
• Especificar o coeficiente de confiança 1 – α;
• Obter uma estimativa preliminar da proporção p;
• Especificar o erro máximo e permitido na estimação;
• Obter o valor de Zα/2 da tabela normal
Estimativa preliminar da proporção p
Dados históricos sobre a população de interesse;
Resultados obtidos em estudos similares ao que está sendo realizado;
Extração de uma amostra-piloto;
Utilizar p = 0,5 (atitude conservadora), valor que corresponde a um máximo para n.
Intervalo de Confiança no MinitabVariância pop. (σ²) conhecida
Digite sua amostra em uma coluna, clique em Stat / Basic Statistic / 1_Sample Z...
Escolha “Confidence Interval”. Em “Level” digite o coeficiente de confiança. Em “Sigma” digite o valor do desvio padrão populacional. Se desejar gráficos clique em “Graphs...”, clique em OK.
Intervalo de Confiança no MinitabVariância pop. (σ²) desconhecida
Digite sua amostra em uma coluna, clique em Stat / Basic Statistic / 1_Sample t...
Escolha “Confidence Interval”. Em “Level” digite o coeficiente de confiança. Se desejar gráficos clique em “Graphs...”, clique em OK.
Teste de hipótese
Teste de hipóteses
Idéia básica: procurar condições que garantam que os resultados de experimentos possam ser generalizados além da situação experimental
O teste de hipóteses consiste na comparação de duas hipóteses, chamadas Hipótese nula e Hipótese alternativa.
Teste de hipóteses
A comparação de duas hipóteses é feita baseada
em evidências experimentais (amostras), sujeitas a
erros amostrais e/ou erros não-amostrais.
Teste de hipóteses
• Hipótese Nula (): É a hipótese a ser testada.
No problema de comparação de dois tratamentos é usual fixar como hipótese de interesse a inexistência de diferença entre os dois tratamentos comparados.
Teste de hipóteses
• Hipótese Alternativa (): A hipótese nula deve ser comparada com uma hipótese alternativa.
Para cada situação existem hipóteses alternativas adequadas.
Teste de Hipóteses
• Exemplo:
Fischl et al. (1987) publicaram o primeiro relato de um ensaio clínico que comprovou a eficácia de zidovudina (AZT) para prolongar a vida de pacientes com AIDS. Os dados centrais do trabalho estão na Tabela a seguir.
Teste de Hipóteses
GrupoSituação
TotalVivo Morto
AZT 144 1 145
Placebo 121 16 137
Total 265 17 282
Tabela: Número de sobreviventes tratados com AZT ou placebo
Teste de Hipóteses
A análise dos dados da tabela consiste basicamente na comparação de duas proporções. A proporção dos que estavam vivos depois de 24 semanas de tratamento foi de 144/145 = 0,993 entre os pacientes que receberam o AZT, enquanto que para o grupo placebo foi de 121/137 = 0,883.
Teste de Hipóteses
Será que o AZT de fato uma droga efetiva para prolongar a vida de pessoas com AIDS?
Teste de Hipóteses
As hipóteses a serem testadas neste exemplo são: Hipótese nula:
Ou seja, a proporção de pacientes com AIDS que tiveram sobrevida é igual para os grupos controle e tratamento
Teste de Hipóteses
Onde e são respectivamente as probabilidades de se observar a resposta de interesse entre os pacientes de grupo controle e os do grupo tratamento.
Teste de Hipóteses
Podemos ter como hipótese alternativa que a proporção de pacientes no grupo tratamento seja superior à do grupo controle.
Teste de Hipóteses
Podemos ter como hipótese alternativa que a proporção de pacientes no grupo tratamento seja inferior à do grupo controle.
Teste de Hipóteses
Ou ainda, a hipótese alternativa que a proporção de pacientes no grupo tratamento seja diferente à do grupo controle.
Critérios de decisão
• Decididas as hipóteses a serem testadas, o próximo passo é construir um critério baseado no qual a hipótese será julgada.
• O critério de decisão é baseado na estatística de teste.
• De uma forma bem genérica e intuitiva podemos dizer que a estatística do teste mede a discrepância entre o que foi observado na amostra e o que seria esperado se a hipótese nula fosse verdadeira.
Critérios de decisão
• Uma grande distância medida pela distribuição de probabilidade é indicação de que não é verdadeira, devendo portanto ser rejeitada.
• Rejeita-se a hipótese nula se o valor da estatística do teste é “grande”. Esse valor deve portanto ser comparado a alguma distribuição de probabilidade que depende de cada caso, como veremos mais a diante.
Erros na conclusão do teste de hipóteses
Por causa das flutuações amostrais, ao comparar duas hipóteses e tomar uma decisão, pode-se tomar a decisão errada.
Dois tipos de erro: Erro Tipo I (α): Rejeitar a hipótese nula quando na realidade ela é verdadeira. Erro Tipo II (): Não rejeitar a hipótese nula quando na realidade ela é falsa.
Erros na conclusão do teste de hipóteses
Realidade (na população)
H0 é verdadeira
H0 é falsa
Conclusão do Teste
(ação baseada na amostra)
Aceitar H0 correto βErro Tipo II
Rejeitar H0 αErro Tipo I
correto
p-valor
É a probabilidade de se observar um resultado tão ou mais extremo que o da amostra, supondo que a hipótese nula seja verdadeira:
p = P(Z ≥ z | H0)
Note que o valor p é calculado com base na amostra, enquanto que é o maior valor p que leva à rejeição da hipótese nula.
Teste de Hipóteses Bicaudal
Teste de Hipóteses monocaudal
Passos para a Construção de um Teste de Hipóteses
Passo 1. Fixe qual a hipótese H0 a ser testada e qual a hipótese alternativa H1;
Passo 2. Use a teoria estatística e as informações disponíveis para decidir qual estatística (estimador) será usada para testar a hipótese H0. Obter as propriedades dessa estatística (distribuição, média, desvio padrão)
Passos para a Construção de um Teste de Hipóteses
Passo 3. Fixe a probabilidade α de cometer o erro tipo I e use este valor para construir a região crítica (regra de decisão);
Passo 4. Use as observações da amostra para calcular o valor da estatística de teste;
Passo 5. Se o valor da estatística calculado com os dados da amostra não pertencer à região crítica, não rejeite H0 ; caso contrário, rejeite H0.
Teste de Hipótese para Média em Populações Normais
Para as Hipóteses (2 é conhecido):
vs (a) H1: > 0 (0 é o valor especificado)
H0: = 0 vs (b) H1: < 0
vs (c) H1: 0
Estatística de Teste:
n
XZ
Regra de Decisão:
a)Rejeitamos H0 se
b)Rejeitamos H0 se
c)Rejeitamos H0 se ou
nzX
)(0
nzX
)(0
nzX
)2/(0 n
zX )2/(0
Teste de Hipótese para Média em Populações Normais
Teste de Hipótese para Média em Populações Normais
5,37X
Exemplo: Considere que desejamos testar as hipóteses abaixo com respeito a uma média populacional . H0 : = 40
HA : ≠ 40Supondo que a população seja normalmente distribuída com variância 2 = 9 e que para uma amostra de tamanho 25 obteve-se uma média igual a 37,5. Realize um teste, ao nível de 10% de significância para essas hipóteses.
),(~ 2 nNX
984,4025
364,140 seou
016,3925
364,140 se Rejeito 0
X
XH
Teste bicaudal;Decisão: Rejeito H0 Usando o valor p = 0,00001 rejeitamos H0;Conclusão: Ao nível de significância de 0,10 rejeitamos a hipótese de que a média é igual a 40, ou seja, aceitamos a hipótese alternativa.
Teste de Hipótese para Média em Populações Normais
Teste de Hipóteses no Minitab Digite sua amostra em uma coluna, Clique em Stat /
Basic Statistic / Store Discriptive Statistics . Escolha as opções que você deseja, clique em OK.
Novamente clique em Stat / Basic Statistic / 1_Sample Z.
Escolha “Test Mean” digite a média. Em “Alternative” escolha a opção unicaudal
inferior“less equal”, bicaudal“not equal”e unicaudal superior“greater than”
Em “Sigma” digite desvio padrão da população, clique em OK.
Teste de Hipótese para Média em Populações Normais
Para as Hipóteses (2 é desconhecido):
vs (a) HA: > 0 (0 é um valor especificado)
H0: = 0 vs (b) HA: < 0
vs (c) HA: 0
Estatística de Teste:
n
SX
TSdodesconheci
Regra de Decisão:
a)Rejeitamos H0 se
b)Rejeitamos H0 se
c)Rejeitamos H0 se ou
n
StX n );1(0
n
StX n );1(0
n
StX n );1(0
n
StX n );1(0
Teste de Hipótese para Média em Populações Normais
Exemplo: Um fabricante de baterias declarou que a capacidade média de um certo tipo de bateria que sua empresa produz é de pelo menos 140 amperes por hora. Um órgão independente de proteção ao consumidor deseja testar a credibilidade da declaração do fabricante e mede a capacidade de uma amostra aleatória de 20 baterias, de um lote produzido recentemente. Os resultados em amperes/hora, são os seguintes:
137,4 140,0 138,8 139,1 144,4 139,2 141,8 137,3 133,5 138,2
141,1 139,7 136,7 136,3 135,6 138,0 140,9 140,6 136,7 134,1
H0: = 140 n = 20 = 0,05
HA: < 140 S2= 7,0706 S = 2,66
Decisão: rejeita H0
Conclusão: há evidências que levam a crer que a declaração do fabricante está superestimada e o órgão de proteção ao consumidor deveria dar início a uma ação corretiva contra a firma.
138,47X
138,9720
2,66729,1140 se Rejeito 0 XH
Teste de Hipótese para Média em Populações Normais
Teste de Hipótese com grandes amostras para uma Proporção populacional
Para as Hipóteses
vs (a) HA: p > p0 (p0 é um valor especificado)
H0: p = p0 vs (b) HA: p < p0
vs (c) HA: p p0
Se n é grande
Estatística de Teste:n
p1p
ppZ
00
00
)(
ˆ
n
p1ppNormalp
)(,ˆ
Regra de Decisão:
a)Rejeitamos H0 se Z0 z()
b)Rejeitamos H0 se Z0 -z()
c)Rejeitamos H0 se Z0 z(/2) ou Z0 -z(/2)
Teste de Hipótese com grandes amostras para uma Proporção populacional
Exemplo: Um fabricante garante que 90% dos equipamentos que fornece a uma fábrica estão de acordo com as especificações exigidas. O exame de uma amostra de 200 peças desse equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, nos níveis de 5% e 1%.
p = proporção de equipamentos que estão de acordo com as especificações exigidas.
H0: p = 0,9
HA: p < 0,9
= 0,05 e = 0,01 p0 = 0,90 n = 200
880200
251p ,ˆ
Teste de Hipótese com grandes amostras para uma Proporção populacional
Como a amostra é igual (n = 200), vale a aproximação normal
Rej. H0 (90% dos equip. de acordo c/ especf.) se Z0 -z()Como –0,94 > -1,96 e –0,94 > -2,57
Decisão: Não rejeitamos H0 Conclusão: Aos níveis de significância de 5% e 1% não há evidências de que os equipamentos estejam fora das especificações exigidas.
94,0
2000,9)0,9(1
0,90,880
Z
Top Related