Kruskal Wallis Aplicacao

Post on 06-Nov-2015

218 views 0 download

description

Aplicação de terstes não paramétricos

Transcript of Kruskal Wallis Aplicacao

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, p. 27-34, jan./dez. 2008

    * Ps-graduandos em Biologia Vegetal, Departamento de Botnica, Instituto de Biocincias, UniversidadeEstadual Paulista, UNESP, Rio Claro, SP, Brasil (e-mail: nuandii@hotmail.com.br;drebianconi@yahoo.com.br).

    ** Doutores em Estatstica, professores, Departamento de Estatstica, Matemtica Aplicada e Computao,UNESP, Rio Claro, SP, Brasil (e-mail: jsgovone@rc.unesp.br; piao@rc.unesp.br).

    *** Doutor em Cincias Biolgicas, professor, Departamento de Zoologia, Instituto de Biocincias, UNESP,Rio Claro, SP, Brasil (e-mail: vonzuben@rc.unesp.br).

    **** Doutor em Entomologia, professor, Departamento de Ecologia, UNESP, Rio Claro, SP, Brasil (e-mail:mapizano@rc.unesp.br).

    TRANSFORMAO DE DADOS E IMPLICAES DAUTILIZAO DO TESTE DE KRUSKAL-WALLIS

    EM PESQUISAS AGROECOLGICAS

    ANDR BIANCONI*JOS SILVIO GOVONE**

    CLUDIO JOSE VON ZUBEN***ANTONIO CARLOS SIMES PIO**

    MARCOS APARECIDO PIZANO****LUS FERNANDO ALBERTI*

    Neste trabalho foram discutidos aspectosconceituais e prticos (mediante exemplo hipotticocom Lycopersicum esculentum) que devem serlevados em considerao na utilizao do teste deKruskal-Wallis (teste estatstico no-paramtrico),enfatizando-se as complicaes que podem surgirse esse procedimento estatstico for implementadode maneira arbitrria em estudos agroecolgicos.Tambm foram abordados os equvocos que podemser cometidos ao serem feitas afirmaes muitogerais sobre as transformaes de dados, maisespecificamente a transformao arco seno da raizquadrada no caso de dados referentes apropores. A cuidadosa ponderao sobre asimplicaes dos resultados de testes paramtricose no-paramtricos deve estar presente como fatoressencial no delineamento experimental depesquisas agroecolgicas. O exemplo hipotticoconsiderado indicou que os resultados desses doistipos de teste no permitem as mesmas conclusesem situaes com tamanho amostral reduzido.

    PALAVRAS-CHAVE: TESTE DE DUNN; MTODOS NO-PARAMTRICOS; AGROECOLOGIA;TRANSFORMAO DE DADOS; ESTATSTICA.

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 200828

    1 INTRODUO

    O uso do termo agroecologia data da dcada de 1970 (ALTIERI, 1995). Existem indcios deque prticas agroecolgicas sejam to antigas quanto as prprias origens da agricultura, sendo asformas de agricultura tradicional presentes em algumas comunidades indgenas atuais uma provadesse fato (ALTIERI, 1995; PEDIGO, 1999). A partir do amadurecimento do conceito de ecossistema,ocorrido na dcada de 1950, formou-se, pela primeira vez, a estrutura bsica para examinar a agriculturamediante abordagem ecolgica (GLIESSMAN, 2000).

    Muitos projetos sob a abordagem agroecolgica tm gerado e adaptado inovaes tecnolgicascapazes de contribuir para a melhoria da segurana alimentar da populao humana, fortalecendo aproduo de subsistncia, gerando fontes de renda e melhorando a base de recursos naturais. Masno so raras as pesquisas agroecolgicas em que h carncias na metodologia que, de certa forma,inviabilizam a plena aplicao ou extrapolao dos resultados apresentados (EHLERS, 1999; ALTIERI,2001; LCIO et al., 2003).

    Para que se analise determinada rea de produo agrcola como um sistema necessrioque sejam compreendidas as interaes dos processos ecolgicos, econmicos e sociais que nelaocorrem (PESSOA et al., 1997; ALTIERI, 2001). Para tanto o uso de modelos matemticos e simuladoresque representem a integrao das variveis envolvidas nesses processos aparecem como importanteferramenta na pesquisa agropecuria (PESSOA et al., 1997).

    Em todas as reas de pesquisa cientfica, testar estatisticamente hipteses pode constituirprocedimento til para o desenvolvimento e aprimoramento do nvel de conhecimento vigente. Aagroecologia uma cincia em que testar hipteses tornou-se essencial para o avano e fortalecimentode suas bases tericas.

    A Estatstica Experimental pode ser considerada como ferramenta imprescindvel para ospesquisadores das cincias agrrias, auxiliando na elucidao de princpios biolgicos e na soluode problemas agrcolas (FERREIRA, 2000; STORCK et al., 2000).

    Na literatura referente aos mtodos alternativos de produo de alimentos, o emprego detestes de hiptese ainda no apresentado como parte importante das pesquisas agroecolgicas.No so raras as obras relacionadas agroecologia dedicadas integralmente aos aspectos polticos esocioeconmicos (LAMARCHE, 1998) da produo alternativa, ou que ampliam seus enfoques paraquestes biolgicas ou ecolgicas (VIVAN, 1998; ALTIERI et al., 2003), sem que a EstatsticaExperimental seja inserida nas discusses. Por exemplo, a generalizao de que o delineamento emblocos casualizados o mais freqente em pesquisas agropecurias (PIMENTEL GOMES, 1984;FERREIRA, 2000; STORCK et al., 2000) no poderia ser efetuada em relao s pesquisasagroecolgicas.

    Diferentemente do que ocorre em pesquisas agronmicas convencionais, no possveldescrever as principais tcnicas estatsticas utilizadas em agroecologia em relao freqncia detestes empregados ou a propriedade na sua utilizao.

    Existem trabalhos em que os potenciais usos de tcnicas de inteligncia artificial, como asredes neurais artificiais (SCHULTZ e WIELAND, 1997; SCHULTZ et al., 2000) so discutidos,contrastando-as com tcnicas estatsticas multivariadas. Contudo, tais discusses so normalmenterealizadas por profissionais da rea das cincias da computao e dirigidas s perspectivas de aplicaodessas ferramentas. Assim, a agroecologia vem recebendo a ateno de pesquisadores de diversasreas para que os dados oriundos de trabalhados agroecolgicos venham a ser matemtica ouestatisticamente mais explorados.

    Um procedimento estatstico no-paramtrico de ampla utilizao em cincias biolgicas eque pode ser aplicado em estudos agroeclogicos o teste de Kruskal-Wallis. Trata-se de testesimples, de fcil execuo e bem descrito em livros de estatstica bsica (CAMPOS, 1983; SIEGEL eCASTELLAN JR., 1988; ZAR, 1999). Como esse teste pode ser aplicado em muitas situaes em que

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 2008 29

    a Anlise de Varincia de Um Critrio deveria ser empregada procurou-se, no presente trabalho, discutir osaspectos desse teste no-paramtrico com nfase nas complicaes que podem surgir se for utilizado demaneira arbitrria. Para tanto, utilizou-se exemplo hipottico com Lycopersicum esculentum (tomateiro)para ressaltar os cuidados que devem ser tomados ao se utilizar tal tcnica em estudos agroecolgicos.Outro procedimento importante a ser considerado em experimentao a transformao de dados. Essetpico tambm foi abordado mediante discusso sobre a propriedade de preconizaes encontradas naliteratura sobre a transformao angular de dados, enfatizando-se os dados referentes a propores.

    O teste de Kruskal-Wallis (ou Anlise de Varincia por Postos), diferentemente do que ocorrecom a Anlise de Varincia de Um Critrio (ou ANOVA de Fisher, teste paramtrico), no exige assuposies de normalidade da varivel, nem homogeneidade de varincias entre os tratamentos. caracterizado como teste livre de distribuio, ou seja, a distribuio terica populacional dos dadosno precisa ser estimada pelas mdias ou varincias amostrais para sua correta aplicao. Quandose detecta diferena significativa entre os tratamentos pelo teste de Kruskal-Wallis, usualmente soefetuadas comparaes mltiplas envolvendo todos os pares de tratamentos. O teste de Dunn podeser aplicado para tal finalidade (ZAR, 1999), sendo verificado freqentemente na literatura cientfica ebem descrito em obras de estatstica. Fato interessante sobre o teste de Dunn que, apesar de seuamplo uso, pouco se discute sobre seu poder.

    2 TESTES A POSTERIORI EM EXEMPLO COM TOMATEIRO

    Supondo para facilidade de visualizao e interpretao que a varivel de estudo seja o pesoem quilogramas de frutos de L. esculentum perdidos (sem valor econmico) devido ao ataque porpragas em trs diferentes tratamentos (Tabela 1), a saber: duas aplicaes de inseticida (na mesmadosagem) no espaamento temporal de sete dias entre elas; apenas uma aplicao de inseticida namesma dosagem de cada aplicao do tratamento anterior; e a no-aplicao de qualquer tipo deinseticida.

    Se cada tratamento tivesse cinco parcelas (repeties) com caractersticas pedolgicas,edficas e ecolgicas suficientemente homogneas em razo da rea de estudo envolver pequenapropriedade rural, poderia ser considerado o delineamento como sendo inteiramente ao acaso. Aaplicao do teste de Kruskal-Wallis aos dados das cinco repeties de cada tratamento reveloudiferenas entre tratamentos (como se poderia esperar pela simples observao dos dados), poiso valor de probabilidade obtido no teste 0,002. Aplicando posteriormente o teste de Dunn aesses dados detecta-se que a nica diferena significativa (p

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 200830

    indicou que todos os pares de tratamentos apresentam diferenas significativas com todos os p-valores inferiores a 0,05. Assim, o simples aumento no nmero de repeties em cinco unidades jpermite concluses distintas das anteriores. Pode-se afirmar que os trs tratamentos so distintos,como claramente indicam os dados, evidenciando baixo poder do teste de Dunn para amostras pequenas.

    TABELA 1 DADOS HIPOTTICOS DE PESO (Kg) DE FRUTOS NO-COMERCIALIZVEIS DEL. esculentum, CONSIDERANDO TRS TRATAMENTOS: (1) DUAS APLICAES DE

    INSETICIDA COM ESPAAMENTO DE SETE DIAS ENTRE ELAS; (2) UMA NICAAPLICAO DE INSETICIDA, MESMA DOSAGEM DE CADA APLICAO DO

    PRIMEIRO TRATAMENTO, e (3) NENHUMA APLICAO DE INSETICIDA

    *Os nmeros na frente das mdias aritmticas e desvios-padres indicam o intervalo de parcelas considerado para osclculos desses.

    Tratamentos Parcelas

    (repeties-ver texto) 1 (duas aplicaes)

    2 (uma aplicao)

    3 (sem aplicao)

    1 250 850 1900

    2 270 790 2040

    3 230 870 1960

    4 290 800 1820

    5 300 920 2000

    Mdia 1-5* 268 846 1944

    Desvio-padro 1-5 28,64 53,20 86,49

    6 250 850 1930

    7 270 790 2060

    8 230 870 1980

    9 290 800 1840

    10 300 920 1910

    Mdia 6-10 268 846 1944

    Desvio-padro 6-10 28,64 53,20 82,04

    Mdia 1-10 286 846 1944

    Desvio-padro 1-10 27,00 50,16 79,47

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 2008 31

    O teste de Shapiro & Wilk (W) foi utilizado para verificar a normalidade dos dados em todos ostrs tratamentos. Tanto na primeira situao (em que foram consideradas apenas as cinco primeirasparcelas) quanto na segunda (considerando-se as dez parcelas), todos os tratamentos apresentaramp-valores no-significativos ao nvel de 10% (o menor de todos os p-valores foi 0,15 para o tratamento2, com dez repeties). Pode-se ento concluir que a falta de normalidade por si s no justificaria aadoo de teste no-paramtrico nesse caso. Em relao homogeneidade de varincias, o teste deLevene (VIEIRA, 2006) indicou que os trs tratamentos no apresentam homocedasticidade (p=0,01),considerando-se as dez parcelas conjuntamente.

    Qualquer teste para se detectar normalidade ou homogeneidade de varincias serve maiscomo indicao ou orientao ao pesquisador do que como fato inquestionvel para se utilizar ou noalgum teste paramtrico.

    No caso do peso de tomates em quilogramas, varivel contnua, poder-se-ia questionar se aexistncia de heterocedasticidade seria suficiente para se utilizar um teste estatstico que transformaos dados em postos e compara os tratamentos baseando-se na diferena da distribuio dos postosentre os tratamentos. Haver perda considervel de informao, pois em vez de se quantificar amagnitude da diferena entre os valores pode-se apenas saber qual valor maior do que outro.

    Nas duas situaes hipotticas (com cinco e dez parcelas) a Anlise de Varincia paramtricae o teste de Tukey, utilizado analogamente ao teste de Dunn, detectaram diferenas significativasentre todos os pares de comparaes (todos os p-valores inferiores a 0,01). Dessa forma, tanto o testede Tukey (usado aps a Anlise de Varincia paramtrica) como o teste de Dunn (utilizado aps o deKruskal-Wallis) detectaram a evidente diferena entre os trs tratamentos e as diferenas entre ospares de comparaes quando analisadas as dez parcelas conjuntamente. Entretanto, os dois testesa posteriori no forneceram os mesmos resultados no caso em que se considerou apenas as primeirascinco parcelas (situao com menor tamanho amostral).

    Em algumas situaes prticas, devido ao tamanho da rea rural (ou de pesquisa) e/ou dasdificuldades em se realizar a manuteno de parcelas sem o uso de agroqumicos, o pesquisadorpode deparar-se com nmero reduzido de repeties por tratamento (como apresentado no exemplohipottico).

    VIEIRA (2003) cita que o tamanho amostral reduzido, juntamente com a falta de certeza dopesquisador sobre as questes de normalidade e homocedasticidade, so critrios que podem levar escolha de teste no-paramtrico. O cuidado em ponderar as implicaes das eficincias dos testesa posteriori, em cada caso (paramtrico e no-paramtrico) deve estar presente como fator de grandeimportncia no delineamento experimental de pesquisas agroecolgicas.

    A escolha pelo teste no-paramtrico, no exemplo com tomateiro, ainda que no possa serconsiderada incorreta, evidenciou perda de informao que no ocorreria com a utilizao do testeparamtrico.

    PIMENTEL GOMES (1984), referindo-se ao teste de Kruskal-Wallis, considera que a avaliaode diferenas entre tratamentos baseada apenas na ordem dos valores dos dados, sem nenhumcritrio quantitativo mais preciso, pode prejudicar a interpretao econmica dos resultados. Dessaforma, de grande importncia que o pesquisador avalie criteriosamente a necessidade de utilizaode teste no-paramtrico em situao semelhante ao exemplo citado.

    3 TRANSFORMAO DE DADOS: O ARCO SENO DA RAIZ QUADRADA

    Para tentar resolver o problema da falta de normalidade dos dados e/ou da heterocedasticidade muito comum serem encontrados dados transformados na literatura de diversas reas de pesquisa.As transformaes raiz quadrada, arco seno da raiz quadrada ou logartmica dos dados originais soas solues possveis mais empregadas (HOAGLIN et al., 1983; ZAR, 1999).

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 200832

    Muito se discute sobre os casos em que determinado tipo de transformao funciona commaior ou menor propriedade quando se trata de problemas referentes ausncia de normalidade ouhomogeneidade de varincias. Contudo, o fato que normalmente no fica to relevante em textosbsicos o de que as transformaes acima citadas apenas podem corrigir os problemas de falta denormalidade e/ou ausncia de homogeneidade de varincias. Se tais problemas no existirem, nohaver razo aparente para execut-las.

    A proporo (ou porcentagem) de sementes germinadas num experimento constitui varivelfreqente e de muita importncia em pesquisas agrcolas, incluindo as de enfoque agroecolgico. Atransformao para o arco seno da raiz quadrada das propores costuma ser indicada como soluopossvel e eficiente, quando os dados dessa varivel compem tratamentos que no apresentamhomocedasticidade (VIEIRA, 2006).

    LABOURIAU (1983), em relevante obra sobre germinao de sementes, atesta que compropores no possvel efetuar Anlise de Varincia ou teste t de Student (testes paramtricos).Caso as propores estejam entre 0,05 e 0,95 pode-se usar aproximao angular e depois aplicarprocedimento paramtrico. Segundo esse mesmo autor, tal caracterstica precisa serconstantemente lembrada, ou seja, propores necessariamente devero ser transformadas.Contudo, no caso em que as propores constituem amostras normais ou sem heterogeneidadede varincias deve-se questionar a lgica da transformao. Os dados, ao serem transformadospara o arco seno da raiz quadrada, em vez de serem propores passam a representar valores dengulos (usualmente em radianos).

    Aps a transformao no possvel referir-se mdia da proporo de germinao emdeterminado tratamento, mas sim mdia (em radianos ou graus) dos arcos senos das razesquadradas das propores em determinado tratamento. Tal dado, em geral, menos informativoao pesquisador do que a mdia das propores originais, ou seja, afirmar-se que dados deporcentagem ou proporo devem necessariamente ser transformados pode ser considerado muitogeneralista.

    4 CONSIDERAES FINAIS

    As discusses e exemplos apresentados neste trabalho versaram sobre questes elementaresreferentes aplicao do teste de Kruskal-Wallis e transformao angular de dados, procedimentosamplamente encontrados na literatura cientfica e bem descritos em livros-textos. O que se procurouenfatizar so peculiaridades importantes de tais mtodos, inerentes s suas propriedades matemticasou s caractersticas de suas distribuies estatsticas, que usualmente podem no ser claras aosprofissionais da rea de agroecologia.

    No exemplo hipottico apresentado neste trabalho, os resultados de dois testes a posteriori nopossibilitaram as mesmas concluses no caso em que se considerou menor nmero de repeties(menor tamanho amostral). A cuidadosa ponderao sobre as implicaes e a eficincia de testes aposteriori, em cada caso (paramtrico e no-paramtrico), deve estar presente como fator essencialno delineamento experimental de pesquisas agroecolgicas.

    ABSTRACT

    DATA TRANSFORMATION AND IMPLICATIONS OF USING THE KRUSKAL-WALLIS TEST INAGROECOLOGICAL RESEARCH

    In the present work, conceptual and practical aspects (hypothetical example using Lycopersicum esculentum)which must be considered in the utilization of the Kruskal-Wallis test (a nonparametric statistic test) werediscussed, highlighting the possible complications when such test is arbitrarily implemented in agroecologicalstudies. Furthermore, it was considered the equivocation that could occur when rather general assertions

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 2008 33

    concerning data transformation are made, mainly about the arcsine transformation of the square root onproportion data. Careful consideration in relation to the implications of the outcomes derived from parametricand nonparametric testes should be present as an essential feature in agroecological experimental designs.As indicated in our hypothetical example, such outcomes derived from both tests might not permit the sameconclusions in small sample size situations.

    KEY-WORDS: DUNN TEST; NONPARAMETRIC METHODS; AGROECOLOGY; DATA TRANSFORMATION;STATISTICS.

    REFERNCIAS

    1 ALTIERI, M.A. Agroecology: the science of sustainable agriculture. London: Westview Press, 1995.433 p.

    2 ALTIERI, M.A. Agroecologia a dinmica produtiva da agricultura sustentvel. 3.ed. Porto Alegre:Editora da Universidade, 2001.110 p.

    3 ALTIERI, M.A. et al. O papel da biodiversidade no manejo de pragas. Ribeiro Preto: Holos Editora,2003. 226 p.

    4 CAMPOS, H. Estatstica experimental no-paramtrica. 4.ed. Piracicaba: ESALQ-USP, 1983. 350 p.

    5 EHLERS, E. Agricultura sustentvel: origens e perspectivas de um novo paradigma. 2.ed. Guaba:Livraria e Editora Agropecuria, 1999. 178 p.

    6 FERREIRA, P.V. Estatstica experimental aplicada agronomia. 3.ed. Macei: EDUFAL, 2000. 422 p.

    7 GLIESSMAN, S.R. Agroecology ecological processes in sustainable agriculture. Boca Raton: LevinPublishers, 2000. 358 p.

    8 HOAGLIN, D.C. et al. Understanding robust and exploratory data analysis. New York: John Wiley &Sons, 1983. 447 p.

    9 LABOURIAU, L.G. A germinao de sementes. Washington D.C.: Secretaria Geral da Organizao dosEstados Americanos, 1983. 175 p.

    10 LAMARCHE, H. A agricultura familiar: do mito realidade. Campinas: Editora da Unicamp, 1998. 348 p.

    11 LCIO, A. D. et al. Caractersticas experimentais das publicaes da Cincia Rural de 1971 a 2000.Cincia Rural, v.33, n.1, p. 161-164, 2003.

    12 PEDIGO, L.P. Entomology and pest management. 3rd ed. London: Prentice Hall, 1999. 691 p.

    13 PESSOA, M.C.P.Y. et al. Principais modelos e simuladores utilizados para anlise de impactosambientais de atividades agrcolas. Jaguarina: Embrapa Meio Ambiente, 1997. 80 p.

    14 PIMENTEL GOMES, F. A estatstica moderna na pesquisa agropecuria. Piracicaba: POTAFOS, 1984.160 p.

    15 SCHULTZ, A.; WIELAND, R. The use of neural networks in agroecological modeling. Computers andElectronics in Agriculture, v.18, p.73-90, 1997.

    16 SCHULTZ, A. et al. Neural networks in agroecological modeling stylish application or helpful tool.Computers and Electronics in Agriculture, v.29, p.73-97, 2000.

    17 SIEGEL, S.; CASTELLAN JR., N. J. Nonparametric statistics for the behavioral sciences. 2nd ed. NewYork: McGraw-Hill, 1988. 399 p.

    18 STORCK, L. et al. Experimentao vegetal. Santa Maria: Editora UFSM, 2000. 198 p.

    19 VIEIRA, S. Bioestatstica - tpicos avanados. Rio de Janeiro: Editora Campus, 2003. 212 p.

    20 VIEIRA, S. Anlise de varincia (ANOVA). So Paulo: Editora Atlas, 2006. 204 p.

  • Pesticidas: r. ecotoxicol. e meio ambiente, Curitiba, v. 18, jan./dez. 200834

    21 VIVAN, J. Agricultura & florestas: princpios de uma interao vital. Guaba: Livraria e EditoraAgropecuria, 1998. 207 p.

    22 ZAR, J.H. Biostatistical analysis. 4thed. New Jersey: Prentice Hall Inc., 1999. 938 p.

    AGRADECIMENTOS

    Agradecemos Fundao de Amparo Pesquisa do Estado de So Paulo pela bolsa de mestrado doprimeiro autor (processo 07/02036-1) e ao Conselho Nacional de Desenvolvimento Cientfico e Tecnolgicopela bolsa de produtividade do terceiro autor (processo 308825/2006-3).