UNIVERSIDADE FEDERAL DA PARAÍBA TESTES …tarciana/MPIE/Aula20.pdf · conjunta de duas variáveis...

6
16/6/2014 1 UNIVERSIDADE FEDERAL DA UNIVERSIDADE FEDERAL DA PARAÍBA PARAÍBA Prof. Luiz Medeiros Prof. Luiz Medeiros Departamento de Estatística Departamento de Estatística TESTES NÃO TESTES NÃO- PARAMÉTRICOS PARAMÉTRICOS Parte I Parte I x x Teste Qui-quadrado de independência Um dos principais objetivos de se construir uma tabela de contingência, com o objetivo de se analisar a distribuição conjunta de duas variáveis qualitativas, é descrever a associação entre elas. Ou seja, de certo modo esperamos que haja uma certa dependência entre as variáveis, por exemplo, sexo e ramo de atividade. Desta forma, nosso foco será buscar evidência estatística de que duas variáveis possuem certo grau de associação. Ao fazer esse tipo de investigação em busca de evidência estatística, estamos realizando um Teste de Hipóteses. x Exemplo: Suponha que desejamos verificar se existe associação entre as variáveis tipo de cooperativa e estado, como dado na tabela a seguir. x • Neste caso, um teste Qui-Quadrado pode ser usado para determinar se as duas variáveis (gênero e desempenho profissional, por exemplo) são independentes. Duas variáveis são independentes se a ocorrência de uma não afeta a ocorrência da outra.

Transcript of UNIVERSIDADE FEDERAL DA PARAÍBA TESTES …tarciana/MPIE/Aula20.pdf · conjunta de duas variáveis...

16/6/2014

1

UNIVERSIDADE FEDERAL DA UNIVERSIDADE FEDERAL DA

PARAÍBAPARAÍBA

Prof. Luiz MedeirosProf. Luiz MedeirosDepartamento de EstatísticaDepartamento de Estatística

TESTES NÃOTESTES NÃO--

PARAMÉTRICOS PARAMÉTRICOS

Parte IParte I

x

x

Teste Qui-quadrado de independência

Um dos principais objetivos de se construir uma tabela decontingência, com o objetivo de se analisar a distribuiçãoconjunta de duas variáveis qualitativas, é descrever aassociação entre elas.

Ou seja, de certo modo esperamos que haja uma certadependência entre as variáveis, por exemplo, sexo e ramo deatividade. Desta forma, nosso foco será buscar evidênciaestatística de que duas variáveis possuem certo grau deassociação.

Ao fazer esse tipo de investigação em busca de evidênciaestatística, estamos realizando um Teste de Hipóteses.

x

Exemplo: Suponha que desejamos verificar se existeassociação entre as variáveis tipo de cooperativa e estado,como dado na tabela a seguir.

x

• Neste caso, um teste Qui-Quadrado pode ser usado para determinar seas duas variáveis (gênero e desempenho profissional, por exemplo) sãoindependentes. Duas variáveis são independentes se a ocorrência de umanão afeta a ocorrência da outra.

16/6/2014

2

Teste Qui-Quadrado de independência

•O teste de independência Qui-Quadrado é usado para descobrir se existeuma associação entre a variável da linha e a variável da coluna em umatabela de contingência construído à partir de dados da amostra.

• Para realização do teste, se faz necessário calcular o valor esperado decada célula. Supondo-se que as variáveis sejam independentes, o valoresperado de cada célula será:

• E1,1=(648)(376)/1551=157,09

• E1,2=(648)(643)/1551=268,64

Podemos calcular todos os outros valores de forma similar.

Teste Qui-quadrado de independência

• Utilizaremos uma medida global para verificar se existeassociação entre as variáveis. Esta medida será dada atravésdo afastamento global entre valores observados e valoresesperados.

• Esta medida é chamada de de Pearson (Qui-quadrado dePearson) e sua estatística de teste é dada pela expressão:

em que Oij e Eij são, respectivamente, as frequênciasobservadas e esperadas da r-ésima linha e j-ésima coluna. Sea hipótese de independência (não-associação) for verdadeira,o valor da estatística de teste será próximo de zero.

χ2

Importante

Para validação do teste, se faz necessário que sejamrespeitados alguns critérios:

• Os dados serem selecionados aleatoriamente.

• Todas as frequências esperadas sejam maiores ou igual a 1.

• Não mais de 20% das frequências esperadas sejaminferiores a 5.

Obs: O teste está baseado na comparação entre duas hipóteses,denominadas, respectivamente de, hipótese nula e hipótese alternativa. Ahipótese nula é de que as variáveis não estão associadas, em outraspalavras, eles são independentes. A hipótese alternativa é de que asvariáveis estão associadas, ou dependentes.

Etapas do Teste

Etapa 1: Definição das hipóteses

Etapa 2: Estabelecer o nível de significância (α)(Definida pelo pesquisador)

Etapa 3: Determinar a distribuiçãoamostral

[1-α;(r-1)(c-1)]

Etapa 4: Determinar o valor crítico(Tabela qui-quadrado)

Etapa 5: Determinar a região de rejeição (Ver gráfico)

χ2

H0: As variáveis são independentes.

H1: As variáveis não são independentes.

x

Etapas do Teste

Etapa 6: Calcular a estatística do teste (Valor )

Etapa 7: Tomada de decisão. Verificar se a estatística do teste cai na região de rejeição ou não.

Etapa 8: Interpretação do teste

16/6/2014

3

Teste de Wilcoxon-Mann-Whitney (WMW)

• O teste de Mann-Whitney-Wilcoxon (MWW) é um teste não-paramétrico alternativo ao teste t-Student para comparar asmédias de duas amostras independentes.

• O único pressuposto exigido para a aplicação do teste MWWé que as duas amostras sejam independentes e aleatórias, eque as variáveis em análise sejam numéricas ou ordinais (ospressupostos para a aplicabilidade do teste t-Student são maisexigentes: as populações de onde as amostras provêm têmdistribuição normal; as amostras são independentes ealeatórias; as populações têm uma variância comum).

Teste de Wilcoxon-Mann-Whitney (WMW)

16/6/2014

4

Teste de Wilcoxon-Mann-Whitney (WMW)Teste de Wilcoxon-Mann-Whitney (WMW)

Teste de Wilcoxon-Mann-Whitney (WMW)

• Se ambas as amostras em análise têm tamanhos iguais ou superiores a10 observações, pode fazer-se a aproximação através da distribuiçãonormal, com parâmetros:

Exemplo: Num ensaio delineado com o objetivo de estimar os efeitos dainalação prolongada de óxido de cádmio, 15 cobaias foram sujeitas emlaboratório a um ambiente contaminado com este óxido, e 10 cobaiasestiveram num ambiente normal sem essa contaminação (grupo decontrolo). A variável de interesse é a concentração de hemoglobina após oensaio:

Pretende-se averiguar se a inalação prolongada de óxido de cádmio alterao nível de hemoglobina.

Para um nível de significância α = 5%, e 1 N =15 e 2 N =10, o quantil da distribuição Ude Mann-Whitney-Wilcoxon é U(0,05;15;10)=44, e como a estatística de teste U=25 éinferior a este valor crítico, deve rejeitar-se a hipótese nula de que as duas amostrastêm a mesma mediana, ou seja, deve concluir-se que a exposição ao óxido de cádmioafeta o nível de hemoglobina nas cobaias.

16/6/2014

5

Note-se que existem 3 grupos de números de ordem empatados, cada umcom 2 empates; são nomeadamente os números de ordem 4.5, 8.5 e 10.5.Assim, a variância deve ser calculada por

Usando a aproximação da distribuição normal Usando a aproximação da distribuição normal

Exemplo: Realiza-se um estudo para determinar os efeitos de pôr fim a umbloqueio renal em pacientes cuja função renal está deteriorada devido auma metástase maligna avançada de causa não-urológica. Mede-se apressão arterial de cada paciente antes e depois da cirurgia. Obtêm-se osseguintes resultados:

Podemos concluir que a intervenção cirúrgica tende a diminuir a pressãoarterial?

Antes 150 132 130 116 107 100 101 96 90 78

Depois 90 102 80 82 90 94 84 93 89 87

Exemplo no R

x<-rnorm(10)

y<-rnorm(10)

wilcox.test(x, y, conf.int = TRUE)

____________________________________________

ex1 <- read.table(file.choose(),header=T,dec=".",sep="") # outra forma deler o banco

attach(ex1)

boxplot(efeito ~ trat, col = "red") # gerar o boxplot

wilcox.test(efeito ~ trat, conf.int = TRUE, data = ex1)

Teste de Kruskal-Wallis

É uma extensão do teste Wilcoxon-Mann-Whitney para dadosnão pareados. O teste de Kruskal-Wallis foi criado como umsubstituto ao teste F na análise de variância paramétrica.

Se os valores obtidos nas diversas amostras diferem entre si,o teste proporcionará verificar se estas diferenças são devidasao acaso ou se as amostras provém de populações (mesmoque suas formas não sejam conhecidas) diferentes.

Teste de Kruskal-Wallis

16/6/2014

6

Teste de Kruskal-Wallis

A tabela a seguir mostra os níveis de resíduo de pesticida (PPB)em amostras de sangue de quatro grupos de pessoas. Use o testede Kruskal-Wallis para testar, a um nível de significância de 0,05, ahipótese nula de que não existe diferença nos níveis de PPB nosquatro grupos considerados.

Níveis de PPB

Grupo I 9 10 11 12 23 31 37

Grupo II 4 8 18 19 32 33 35

Grupo III 5 6 6 10 12 15 15

Grupo IV 1 2 3 5 7 8 11

Exemplo no R

attach(airquality)

boxplot(Ozone ~ Month, data = airquality)

kruskal.test(Ozone ~ Month, data = airquality)

library(agricolae)

kruskal(Ozone,Month, alpha = 0.05, group=TRUE)