Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal...

Teste de hipótesesAula 06

Prof. Christopher Freire SouzaCentro de TecnologiaUniversidade Federal de Alagoaswww.ctec.ufal.br/professor/cfs

Objetivos

•Desenvolver habilidades para inferir o comportamento da população a partir de dados de uma amostra

•Desenvolver habilidades para inferir se o comportamento de duas população diferem a partir de dados de duas amostras

•Desenvolver habilidades para estimar o poder de um teste em rejeitar uma hipótese

2

Christopher Souza: Teste de hipóteses

Relevância do conteúdo• Definição e avaliação de hipóteses é o cerne de

estudos científicos• Testes de hipóteses trazem o respaldo

matemático para apoiar afirmações sobre o comportamento da população em estudo


3

Conteúdo

•Fundamentos de testes de hipóteses•Testes sobre uma população•Testes sobre duas populações


4

Fundamentos de testes de hipóteses•Hipótese•Hipótese nula e alternativa•Estatística de teste•Valor crítico•Valor p•Decisões e conclusões•Erro do tipo I e do tipo II•Poder de um teste


5

Hipótese: nula e alternativa

•Em estatística, hipótese é uma afirmação sobre uma propriedade da população

•Teste de hipótese: teste da afirmação•Hipótese nula: afirmação em que o valor de

um parâmetro é comparado a um valor específico▫H0: =0

•Hipótese alternativa: afirmação que se deseja testar▫H1: ≠0, H1: >0, H1: <0


6

Estatística de teste

•Valor usado para tomar decisão sobre a hipótese nula (rejeitá-la ou não)

•Estimativa pela conversão da estatística amostral em um escore (z, t, ²), a partir da suposição de que a hipótese nula seja verdadeira


7

Intervalos de confiança (proporção)• Requisitos:

▫ Amostra aleatória simples.▫ Condições para a

distribuição binomial satisfeitas.

▫ Haver pelo menos 5 sucessos e 5 fracassos, o que permite aproximar pela distribuição normal

• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de proporção esteja inserido no intervalo construído a partir da proporção amostral


8

População Infinita Finita

Margem de Erro

Tamanho da Amostra

Intervalos de confiança(, para conhecido)• Requisitos:

▫ Amostra aleatória simples.

▫ Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino)

• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral


9

População Infinita Finita

Margem de Erro

Tamanho da Amostra

Intervalos de confiança(, para desconhecido)• Requisitos:

▫ Amostra aleatória simples.

▫ Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino)

• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral


10

• Margem de Erro▫ População infinita

▫ População finita

Intervalos de confiança (²)• Requisitos:

▫ Amostra aleatória simples.▫ Distribuição normal mesmo

para grandes amostras• Associa-se um grau de

confiança, e.g. 95%, de que o valor do parâmetro de variância esteja inserido no intervalo construído a partir da variância amostral

• Estima-se desvio amostral a partir da raiz da estimativa do parâmetro de variância


11

Região crítica

•Conjunto de todos os valores da estatística que podem nos fazer rejeitar a hipótese nula

•Definição a partir da escolha do valor crítico, assim como estimado no estudo de intervalos de confiança


12

Intervalos de confiança


13

“Estamos 95% confiantes de que o intervalo ± E contém o valor de ”̂

Valor P

•Probabilidade de obter, no mínimo, um valor da estatística teste tão extremo quanto o valor representado pela amostra

•Obtenção de magnitude do valor P permite a decisão de rejeitar ou não a hipótese nula sem definir a priori o valor crítico

•Rejeitar ou não a hipótese depende da ponderação sobre o que se considera crítico e sua relação com o valor P


14

Decisão e conclusões• Teste da hipótese nula permite:

▫ Rejeitá-la▫ Deixar de a rejeitar

• Se afirmativa original contiver igualdade e for rejeitada, pode se concluir que:▫ Há evidência suficiente para garantir a rejeição de H0

• Senão▫ Não há evidência suficiente para garantir a rejeição de H0

• Se afirmativa original não contiver igualdade e for rejeitada, pode se concluir que:▫ Os dados amostrais apóiam a afirmativa de que H0

• Senão▫ Não há evidência amostral suficiente para apoiar H0


15

Erros• Tipo I ()

▫ Rejeitar H0 quando deveria ser aceita

• Tipo II ()▫ Não rejeitar H0 quando

deveria ser rejeitada

• Controle de erros: , e n estão relacionados


16

Investigações sobre Erro do tipo I• Supondo:

▫ = 0,05▫ = 0,0625▫ n = 64▫ Ho: p=0,5

• Tem-se:▫ z/2=1,96

▫ p/2=0,5 0,1225

• Se utilizarmos =0,01▫ z/2=2,575

▫ p/2=0,5 0,1609

• Se utilizarmos n=100▫ = 0,05▫ z/2=1,96

▫ p/2=0,5 0,098


17

Investigações sobre Erro do tipo II• Supondo:

▫ = 0,05▫ n = 64▫ = 0,0625▫ Ho: p=0,5

▫ p/2=0,5 0,1225

▫ H1: p=0,7

• Tem-se:▫ z1 = (0,5-0,1225-0,7) /

0,0625 = -5,16▫ z2= (0,5+0,1225-0,7)/

0,0625 = -1,24▫ P=0,107488

• Se utilizarmos H1: p=0,55

▫ z1=(0,5-0,1225-0,55) / 0,0625 = -2,76

▫ z2= (0,5+0,1225-0,55)/ 0,0625 = 1,16

▫ P=0,877-0,0029=0,8741

• Se utilizarmos n=100▫ z1 = (0,5-0,1225-0,7) /

0,05 = -6,45▫ z2= (0,5+0,1225-0,7)/

0,05 = -1,55▫ P=0,0606


18

Investigações sobre Erro do tipo II• Supondo:

▫ = 0,05▫ n = 64▫ = 0,0625▫ Ho: p=0,5

▫ p/2=0,5 0,1225

▫ H1: p=0,7

• Tem-se:▫ z1 = (0,5-0,1225-0,7) /

0,0625 = -5,16▫ z2= (0,5+0,1225-0,7)/

0,0625 = -1,24▫ P=0,107488

• Se utilizarmos =0,01▫ z1=(0,5-0,1609-0,7) /

0,0625 = -5,77▫ z2= (0,5+0,1609-0,7)/

0,0625 = -0,625▫ P=0,266


19

Resumo de investigações• Quando n aumenta, os

dois erros diminuem• Quando diminui,

aumenta• Erro tipo II mais provável

se H1 se aproxima de H0

• Maior interesse em detectar grandes diferenças entre valores supostos (H0) e verdadeiros (H1)

p/2 n ,p=0,7 ,p=0,55

0,5 0,1225

64 5 0,107488

0,8741

0,5 0,1609

64 1 0,266

0,5 0,098

100 5 0,0606


20

Poder de um teste• Poder de apoiar uma

hipótese alternativa verdadeira (1-).


21

Testes de hipóteses sobre uma populaçãoMétodo tradicional Valor P

• Comparação de estatística de teste, z, t ou ², com valor crítico para o nível de confiança

• estatística de teste é estimada como visto nas distribuições de estatísticas amostrais, normal para médias, t e ²,

• Comparação de áreas sob as curvas estimadas a partir da estatística de teste e a região crítica

22


Testes de hipóteses sobre uma população•Método do intervalo de confiança

▫Comparação de intervalos de confiança com valor crítico para o nível de significância

▫Se valor crítico for inferior ao intervalo, rejeita-se a hipótese nula


23

Amostra não-normal

•Uma hipótese (a ser testada):▫(Dúvida:) Estatística de teste = valor obtido

da amostra original▫Valor crítico estimado por percentil da

distribuição bootstrap▫Método do intervalo de confiança não se

aplica


24

Inferências sobre duas proporções• Requisitos:

▫ Amostras aleatórias simples.

▫ Condições para a distribuição binomial satisfeitas.

▫ Haver pelo menos 5 sucessos e 5 fracassos em cada amostra, o que permite aproximar pela distribuição normal

• Proporção amostral combinada:


25

• Estatística de teste:

• Estimativa de intervalo de confiança

Inferências sobre duas médiasAmostras independentes, desconhecido• Requisitos:


▫ Distribuições normais ou n>30

• Sugestão:▫ Analise preliminarmente

as amostras• Para identificar valores

críticos:


26



Inferências sobre duas médiasAmostras independentes, conhecido• Requisitos:




as amostras


27



Inferências sobre duas médiasAmostras emparelhadas, desconhecido• Requisitos:




as amostras• Dados trabalhados como

diferenças de valores emparelhados (d)


28



Inferências sobre duas variações• Requisitos:


▫ Populações independentes

▫ Distribuição normal• std1>std2


29


Inferências sobre duas variações• Método Conte Cinco

▫ Não requer distribuição normal

▫ Tamanhos amostrais iguais

▫ Se uma das amostras têm pelo menos cinco dos maiores desvios médios absolutos, sua população tem uma maior variância


30

• Teste de Levene-Brown-Forsythe▫ Transforma-se cada

conjunto de dados por meio da subtração de cada dado por sua mediana

▫ Em seguida, aplica-se o teste t para duas populações

Testes não-paramétricosVantagens Desvantagens

• Não exigem que a distribuição seja normal

• São aplicáveis a dados categóricos (qualitativos)

• Cálculos mais simples

• Desperdiçam informação por tratarem dados de forma qualitativa

• Menor eficiência dos testes

31


EficiênciaTeste não-paramétrico, população normalAplicação Paramétrico Não-

paramétricoEficiência

Pares combinados

t ou z Sinais 0,63

Postos com sinais de Wilcoxon

0,95

Duas amostras independentes

t ou z Soma de postos de Wilcoxon

0,95

Várias amostras independentes

F Kruskal-Wallis 0,95

Correlação Correlação linear

Correlação de postos

0,91

Aleatoriedade - Seqüências -


32

Postos• Número atribuído a um

item da amostra de acordo com sua posição na lista ordenada.

• Em caso de empates, aplica-se a média dos postos como valor de posto de cada item com igual valor

• Ex:• x: [12 10 5 5 4 5 11 12]• xo: [4 5 5 5 10 11 12 12]• io: [1 3 3 3 5 6 7,5 7,5]• i: [7,5 5 3 3 1 3 6 7,5]


33

Testes não-paramétricos• Sinais

▫ Proporção = 50%▫ Igualdade de medianas

(pareado)▫ Mediana de uma

população• Soma de Postos de

Wilcoxon (igualdade de medianas)▫ Pareado ▫ Homogeneidade – Mann-

Whitney• Kruskal-Wallis – igualdade

de medianas de três ou mais populações

• Sequências - Inflexões (Aleatoriedade)

• Wald-Wolfowitz (Independência)

• Correlação de Spearman▫ Significância da

correlação▫ Estacionariedade da série

• Pettitt (Quebra de tendência)

• Grubbs e Beck (Outlier)


34

Teste dos sinaisDados nominais (Proporção = 50%)• Requisitos

▫ Amostra aleatória• Fundamento: teste de

freqüência de sinais▫ x = número de vezes que

ocorreu sinal menos freqüente

▫ n = número de sinais positivos e negativos combinados

• Cuidado:▫ Se dados contradizem H1

nem aplica teste, pois deixa-se de fazer sentido o teste


35

• Estatística de teste:• p/ n≤25: x• p/ n>25:

• Valor crítico:• p/ n≤25, buscar x na

tabela A-7 do Triola• p/ n>25, buscar z na

tabela A-2 do Triola

Teste dos sinaisPares combinados (igualdade de medianas)• Procedimento:

▫ Subtrair cada valor da segunda variável pelo correspondente na primeira

▫ Posições de diferenças nulas são excluídas

▫ Série constituída apenas por sinais de diferenças

• Fundamento:▫ Se medianas são iguais,

número de sinais positivos e negativos são iguais


36





Teste dos sinaisMediana de uma população• Procedimento:

▫ Subtrair cada valor da amostra do valor da mediana sugerida em H0

▫ Posições de diferenças nulas são excluídas

▫ Série constituída apenas por sinais de diferenças


37





Soma de postos de WilcoxonDiferença de amostras emparelhadas• Requisito:

▫ Diferenças tem distribuição aproximadamente simétrica.

• a=soma de valores absolutos dos postos negativos das diferenças d não-nulas (51)

• b=soma dos postos positivos das diferenças d não-nulas (15)

• T=min(a,b)• Estatística de teste:• p/ n≤30: T (tab. A-8 para T)

• p/ n>30:

Reg. Sec. d Postos

Sinais

1903 2009 -106 10 -10

1935 1915 20 1 1

1910 2011 -101 9 -9

2496 2463 33 3 3

2108 2180 -72 8 -8

1961 1925 36 4 4

2060 2122 -62 6 -6

1444 1482 -38 5 -5

1612 1542 70 7 7

1316 1443 -127 11 -11

1511 1535 -24 2 -2


38

Soma de postos de WilcoxonDuas amostras independentes

• Requisito:▫ n>10 para cada amostra

• Trabalha também dados ordinais

• Equivale a Mann-Whitney• R=soma dos postos de uma das

amostras• Estatística de teste:

• Onde:


39

Homens Mulheres

Posto IMC IMC Posto

11,5 23,8 19,6 2,5

9 23,2 23,8 11,5

14 24,6 19,6 2,5

17 26,2 29,1 22

10 23,5 25,2 15,5

13 24,5 21,4 5

6 21,5 22,0 7

24 31,4 27,5 19

18 26,4 33,5 25

8 22,7 20,6 4

20 27,8 29,9 23

21 28,1 17,7 1

15,5 25,2

R1=187

n1=13

R1=138

n1=12

Kruskal-WallisIgualdade de medianas de três ou mais populações

• Requisito:▫ n>5 para cada amostra

• H ~ ²k-1

• Equivale a ANOVA• H grande para amostras

muito diferentes (teste unilateral à direita)

• R=soma dos postos de uma das amostras


• Onde:


40

• Para corrigir H em função do número de empates, divida H por

• Onde (m = número de empates para cada valor):

• Valor crítico estimado via ²k-1

SequênciasAleatoriedade

• Sequência: sucessão de dados com mesma característica

• Ex.: valores se acima ou abaixo da mediana

• Trabalha também dados ordinais

• G=número de sequências na amostra

• Aleatoriedade definida se 0<<G<<n

• Estatística de teste:▫ G, se n1<20, n2<20 e

=0,05▫ senão,


41

• onde

▫ n1 e n2 representam número de valores de mesma característica

• Para G como estatística de teste, compare com valores críticos apresentados na tabela A-10 do Triola

Wald-WolfowitzIndependência

• Séries aleatórias podem não ser independentes

• Influência de contribuições subterrâneas às vazões de rio resulta em maior dependência para intervalos menores de discretização

• Para tanto, calcula-se:


42


• onde

Significância de correlação de postos de Spearman• H0: s=0

• H1: s≠0

• Estatística de teste:▫ Se não houver empate

para um mesmo conjunto de dados:

▫ Se houver empate:

• Valores críticos:▫ Se n≤30, use tabela A-9

do Triola▫ Senão,


43

Estacionariedade• Teste de correlação de

Spearman entre postos de dados e suas respectivas posições na série


44

Teste de Grubbs e BeckIdentificação de outliers• Limites para consideração

de outliers são estimados por:▫ Limite superior

▫ Limite inferior

▫ onde


45

Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal...

Documents

Transcript of Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal...