ESTÀTISTICA. (biometria Florestal)

141
  INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA COORDENAÇÃO DE PESQUISAS EM SILVICULTURA TROPICAL LABORATÓRIO DE MANEJO FLORESTAL - LMF BIOMETRIA FLORESTAL Niro Higuchi Joaquim dos Santos Adriano José Nogueira Lima Manaus – AM Março, 2008

Transcript of ESTÀTISTICA. (biometria Florestal)

Page 1: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 1/141

 

 

INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIACOORDENAÇÃO DE PESQUISAS EM SILVICULTURA TROPICAL

LABORATÓRIO DE MANEJO FLORESTAL - LMF

BIOMETRIAFLORESTAL

Niro HiguchiJoaquim dos Santos

Adriano José Nogueira Lima

Manaus – AMMarço, 2008

Page 2: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 2/141

 

 

PARTE 1

Page 3: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 3/141

 

 

Capítulo 1Introdução - Conceitos gerais

A estatística é uma ferramenta importante para o manejo florestal, seja pra quem está

interessado em trabalhar em pesquisas ou pra quem tem a responsabilidade de planejar,executar e acompanhar um projeto. Difícil é separar a estatística pra essas duas frentes. Oobjetivo desta Parte da apostila é aprofundar em conceitos dos indicadores estatísticos maisfreqüentemente utilizados pelos florestais e ajudar na interpretação dos resultados.

Estatística é um ramo do conhecimento científico que consta de conjunto de processosque têm por objeto a observação, a classificação formal e a análise dos fenômenos coletivosou de massa (finalidade descritiva) e, por fim, investigar a possibilidade de fazer inferênciasindutivas válidas a partir dos dados observados e buscar métodos capazes de permitir estainferência (finalidade indutiva). Durante uma defesa de tese no CENA-USP, surgiu um novoconceito para estatística que, segundo Edgard, é "a arte de torturar os números até que eles

confessem aquilo que você quer ouvir."Em inventário florestal, produto sem estatística não é produto. Em inventários, o

 principal produto é o intervalo de confiança para a média estimada. Na pesquisa científica, aestatística pode ser vista como um instrumento de comunicação e, embora o seu uso sejaabsolutamente opcional, ela fornece os modelos que são necessários para estudar as situaçõesque envolvem incertezas, mas a palavra final é sua.

O exercício, a análise e a interpretação do pensamento científico normalmente sãofeitos por meio da linguagem operacional dos conceitos e hipóteses científicas. Isso implicana formulação de hipóteses estatísticas e estabelecimento dos procedimentos de observaçõesdiretas ou de medições.

Linguagem teórica: “quanto mais grossa é a árvore, mais madeira será oferecida àindústria de transformação.” Neste caso, dois conceitos são envolvidos: espessura e madeira.Com definir esses dois conceitos? Espessura pode ser o diâmetro de uma árvore. Madeira

 pode ser a quantidade de material lenhoso disponível para a indústria.

E daí? Que fazemos agora? Temos que operacionalizar as observações e medições deespessura e madeira. Espessura pode ser traduzida operacionalmente, por exemplo, emcentímetros de diâmetro à altura do peito (DAP), medido a 1,3 m do solo. E a madeira, por sua vez, pode ser traduzida como volume cúbico da árvore.

Agora, a hipótese científica pode ser enunciada, em termos de hipótese estatística, daseguinte maneira: “Quanto maior o DAP, maior será o volume da árvore.” Dessa forma, o“pica-pau” fica mais à vontade.

Depois de formulada a hipótese, o passo seguinte consiste em testá-la. Para se testar ashipóteses serão precisos: planejar a coleta de dados, coletar os dados, tratar os dados,

 processar os dados, analisar os resultados e, finalmente, tomar decisões para rejeitar ou não ahipótese estatística formulada (Ver figura 1.1).

O papel da estatística na pesquisa científica é ajudar o pesquisador “pica-pau” aformular as hipóteses e a fixar as regras de decisão.

Page 4: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 4/141

 

Um pouco de filosofia.

- Aristóteles escreveu: “A verdade é um alvo tão grande que dificilmente alguémdeixará de tocá-lo, mas, ao mesmo tempo, ninguém será capaz de acertá-lo em cheio, num sótiro.”

- A meta da ciência é a organização sistemática do conhecimento sobre o universo, baseado nos princípios explanatórios que são genuinamente testáveis.

- O pesquisador tem os dons da instituição e criatividade para saber que o problema éimportante e quais questões devem ser levantadas; a estatística, por sua vez, o assistirá por meio da maximização de output não ambíguos enquanto minimiza os inputs.

- O pesquisador tem que ter em mente que a pesquisa freqüentemente levanta maisquestões do que respostas. Os resultados quase sempre são meramente uma demonstração denossa ignorância e uma declaração mais clara do que não sabemos.

- O pesquisador tem que manter os olhos abertos, sua mente flexível e estar preparado

 para surpresas.- A pesquisa está na cabeça do pesquisador; o laboratório ou o campo meramenteconfirma ou rejeita o que a sua mente concebeu. A sabedoria consiste em conhecer mais asquestões certas para fazer e não nas certas respostas.

- A aplicação indiscriminada dos métodos quantitativos sobre inesgotáveisquantidades de dados não significa que o entendimento científico vai emergir só por causadisso.

1.1. A Natureza da Estatística:

Basicamente, são dois tipos de estatística: descritiva e de inferência.

A ciência da estatística inclui ambas, descritiva e de inferência. A estatística descritivaapareceu primeiro, nos censos feitos na época do império romano. A de Inferência é maisrecente e é baseada na teoria da probabilidade que, por sua vez, não se estabeleceu antes dametade do século XVII.

a) Estatística descritiva => consiste de métodos para organizar e sumarizar asinformações.

O propósito da organização e sumarização é te ajudar na interpretação de um monte deinformações. Os métodos descritivos incluem a construção de gráficos, figuras e tabelas,como também, o cálculo de vários tipos de médias e índices. Exemplos: resultado final de

uma eleição apresentado pelo Tribunal Superior Eleitoral (TSE) – Quadro 1.1, desmatamentona Amazônia – Figura 1.2., áreas desmatadas com autorização e sem autorização – Figura 1.3e as origens da madeira amazônica – Figura 1.4.

 b) Estatística de inferência => consiste de métodos para inferir sobre uma população baseada na informação de uma amostra da população.

A estatística de inferência moderna praticamente surgiu após as publicações científicasde Karl Pearson e Ronald Fisher, no início do século passado (XX). Depois disso, houve umaevolução fantástica dessa ciência, tornando-se aplicável a várias áreas de conhecimento, taiscomo: Eng. Florestal, Agronomia, Biologia, História, Física, Química, Psicologia etc.

Exemplo 1: Pesquisas de opinião realizadas pelas empresas (DATAFOLHA, IBOPE,

VOX POPULI etc), pouco antes de eleições. A Figura 1.5 mostra a dinâmica de opinião deeleitores brasileiros na eleição para presidente de 2002 com base em pesquisas de opiniãorealizadas pelo IBOPE. O resultado do 1º turno é apresentado na última coluna como TSE,

Page 5: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 5/141

 

tirado do Quadro 1.1. Os resultados do IBOPE, do último dia de pesquisa (com margem deerro igual a 1,8%), são praticamente iguais aos oficiais do TSE. A informação do TSE é sobrevotos válidos enquanto que os da pesquisa de opinião são de intenção de votos. Na pesquisade opinião do 1º turno é difícil identificar o voto “nulo”.

Exemplo 2: Pesquisas de opinião sobre o 2º turno da eleição presidencial 2002,realizadas pelo Datafolha. Neste caso, foi possível estimar os percentuais sobre os votosválidos. No último dia da pesquisa (26/10/02), o Datafolha estimou 64% dos votos válidos

 para o Lula e 36% para o Serra. A Figura 1.6 mostra a dinâmica de opinião de eleitores parao2º turno da eleição de 2002. O resultado do TSE (oficial) foi de 61,2% para o Lula e 38,7%

 para o Serra – Quadro 1.1. Considerando a margem de erro de 2% (para mais e para menos),as estimativas do último dia seriam 62% (para menos) para o Lula e 38% (para mais) para oSerra.

Esta parte da estatística de inferência evoluiu muito no Brasil. A prova disso são osresultados finais do primeiro e do segundo turno da eleição presidencial de 2002 que temmuito a ver com as previsões feitas pelas pesquisas de opinião dos vários institutos. O sucesso

tem que ser creditado principalmente pela escolha correta do tipo de amostragem, coleta dedados e processamento & análise dos resultados A evolução da informática tambémcontribuiu muito para o sucesso das pesquisas; o rápido processamento e, conseqüente,análise dos resultados, permitiu a repetição em intervalos de tempo menores – isso éfundamental para a validação dos métodos utilizados que, por sua vez, dá a robusteznecessária para a pesquisa e a sociedade ganha com a maior precisão e confiabilidade das

 pesquisas de opinião.

Exemplo 3: Previsão da área desmatada para 2006 (agosto 2005 a julho 2006) com base no intervalo de confiança (95%) da série histórica de 1978 a 2005 – Figura 1.7. Apesar da confusão das estatísticas e de sua interpretação, com boa vontade e profissionalismo, as

causas do desmatamento poderiam ser identificadas. O desafio é entender a direção que odesmatamento pode tomar no futuro. Sem entender as causas, a direção só pode ser estocástica. A Figura 1.7 ilustra o uso do intervalo de confiança – IC (nível de probabilidadede 95%) para a média do período 1978-2005. De acordo com dinâmica do desmatamento até2005, as chances do desmatamento durante 2005-2006 (agosto 2005 a julho 2006) são: 29%de ficar acima da estimativa máxima provável (maior do que 20.983 km2), 29% abaixo daestimativa mínima provável (menor do que 16.296 km2) e 42 % de ficar dentro do intervalo deconfiança (entre 16.296 a 20.983 km2) – com 95% de chance de acertar.

Exemplo 4: Todos os trabalhos de equações de volume que utilizam os modelosdestrutivos (na maioria das vezes) para ajustar os dados de volume real observado emmodelos matemáticos que serão utilizados, posteriormente, para estimar o volume da árvoreem pé.

Para concluir a discussão, em torno da natureza da estatística, é importante não perder de vista que a opção por uma das duas estatísticas pode ser pessoal. Entretanto, se a escolharecair sobre a de inferência, o pesquisador deve se sujeitar as suas regras e condicionantes. Aestatística de inferência, por sua vez, deve ficar sob as condicionantes da teoria da

 probabilidade, da normalidade e da independência; a violação de uma dessas condicionantesimplica em um comprometimento muito sério de todo o seu trabalho.

1.2. Conceitos Básicos:

Talvez, os conceitos mais importantes para os florestais são erros amostrais e nãoamostrais. Se você conseguir distinguir esses dois conceitos, você sempre fará um trabalhoconfiável e, por conseguinte, a estatística será uma ferramenta útil na execução de seus

Page 6: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 6/141

 

trabalhos de pesquisa, encurtando caminhos para a produção de ciência e de resultados deinventário florestal.

(i) Erro Amostral => é o erro que você comete por não medir toda a população. Este  parâmetro é mensurável e, dependendo da escolha dos métodos, você tem condições deaumentar ou diminuir este erro. De qualquer modo, trata-se de um parâmetro que pode ser controlado e avaliado por você. É o desvio padrão da média ou, simplesmente, erro padrão etem fórmula para o seu cálculo. É a única medida de precisão, por mais paradoxal que possa

 parecer, em qualquer trabalho de pesquisa ou de inventário florestal.

(ii) Erro não-amostral   => é o erro humano, que pode ser cometido acidental oudeliberadamente. É o tipo de erro que você comete ao alocar uma amostra no lugar errado – ex.: no escritório você faz a opção pela amostragem inteiramente aleatória e sorteia asunidades amostrais e distribui em sua área estudo; no campo, entretanto, você não conseguealocá-las de acordo com as coordenadas pré-estabelecidas e alocá-as em outro lugar. Vocêtambém comete erro não-amostral quando utiliza um equipamento defeituoso ou, por 

 preguiça, você “chuta” as medidas de uma determinada variável. O problema desse erro é que

você não consegue dimensioná-lo e, neste caso, não há estatística que dê jeito para consertar omal-feito. A estatística e o computador só são úteis na interpretação de fenômenos observadosquando os dados são de absoluta confiança e sem erros não-amostrais.

Moral: Busque sempre a melhor metodologia para conseguir a maior precisão de seutrabalho sem, contudo, aumentar a possibilidade de cometer erros não-amostrais. BOMPESQUISADOR é aquele que não entrega sua coleta de dados para qualquer “PEÃO”.

(iii) Populações, Parâmetros e Estimativas

A noção central em qualquer problema de amostragem é a existência de umapopulação. Pense em uma população como um agregado de valores unitários, onde a

“unidade” é a coisa sobre a qual a observação é feita e o “valor” é a propriedade observadasobre aquela coisa. População é então o conjunto de todos os indivíduos ou itens sobconsideração. Ou ainda: população é o universo de seu interesse.

Ilustrando:

- se você está interessado em estudar o potencial quantitativo da floresta da ReservaDucke, a POPULAÇÃO é o conjunto de todas as árvores acima de um determinado DAP,existentes naquela área de 10.000 hectares.

- se para você potencial quantitativo significa volume cúbico obtido de equaçõessimples (DAP como variável independente), o volume médio (por hectare, por ex.) de todas asárvores da Reserva Ducke é o PARÂMETRO.

- se você, no entanto, decidir pela avaliação por amostragem e lançar naquela áreaalgumas amostras (ex.: 10 amostras de 1000 m2, aleatoriamente distribuídas), o volume médiodessas amostras é a ESTIMATIVA.

AMOSTRA é aquela parte da população da qual a informação é coletada.

(iv) Tendência (bias), Exatidão e Precisão

TENDÊNCIA ou VIÉS (bias, em inglês) é uma distorção sistemática. Ela pode ser devido a alguma falha na medição, ou no método de selecionar a amostra, ou na técnica deestimar o parâmetro.

Se você medir o DAP com uma fita diamétrica faltando um pedaço na ponta (2 cm),você medirá todas as árvores com 2 cm a mais, ou seja, você superestimará esta variável. Umamaneira prática de minimizar as tendências em medições é por meio de checagens periódicas

Page 7: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 7/141

 

dos instrumentos, treinamento adequado para o pessoal que usa os instrumentos e cuidadocom eles.

Tendência devido o método de amostragem ocorre quando certas unidades ganhammaior ou menor representação na amostra do que na população. Ex.: se você excluir 20metros de bordadura do lado oeste da Reserva Ducke por causa de um igarapé. Neste caso,você está introduzindo tendência em sua avaliação simplesmente porque você não deu amesma oportunidade, para as árvores que ocorrem naquela faixa, em aparecer no seu trabalho.Outro exemplo: quando a equipe econômica faz uma pesquisa nos supermercados do centro-sul e extrapola o custo de vida para todo o Brasil; isso é uma medida tendenciosa que nãoreflete o que se passa em Manaus.

Tendência na forma de estimar determinado parâmetro pode ser introduzida quandovocê, por exemplo, toma o volume médio da Reserva Ducke e junta com o volume médio doDistrito Agropecuário da SUFRAMA (600.000 hectares), para avaliar o potencial madeireiroda região de Manaus. Um volume médio não tendencioso seria uma média ponderadaconsiderando os diferentes tamanhos de cada área, em vez de usar a média aritmética simples

(tendenciosa, neste caso).Importante: A tendência é a mãe do erro não-amostral, por esta razão, evitá-la é sinal

de prudência e sensatez.

PRECISÃO E EXATIDÃO – uma estimativa tendenciosa pode ser PRECISA, masnunca EXATA. Ainda que o Aurélio (dicionário) pense diferente, para os estatísticos,EXATIDÃO refere-se ao sucesso em estimar o valor verdadeiro de uma quantidade;PRECISÃO refere-se à distribuição dos valores amostrais em torno de sua própria média que,se for tendenciosa, não pode ser o valor verdadeiro – Ver figura 1.8. Exatidão ou estreiteza aovalor verdadeiro pode estar ausente por causa da tendência, falta de precisão ou por causa deambas.

Page 8: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 8/141

 

PENSAMENTO 

rejeita ? 

  planejar tratar  coletar processar analisar  

HIPOTETIZAR 

OPERACIONALIZAR 

não, concluir! 

sim, concluir! 

rejeit 

PENSAMENTO 

a ? 

  planejar tratar  co processar  letar analisar  

HIPOTETIZAR 

OPERACIONALIZAR 

não, concluir! 

sim, concluir! 

 

Figura 1.1: Pesquisa científica – do pensamento à inferência.

 

Page 9: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 9/141

 

 Quadro 1.1: Resultados das eleições para presidente de 2002.

002RESULTADOS DAS ELEIÇÕES DE 2

Total de eleitores = 115.254.113

Resultado do 1º turno: nº de votantes = 94.804.126

ordem Número Candidato total votos % válidos

1 13 Lula 39.454.692 46,44 

2 45 José Serra 19.705.061 23,20

3 40 Garotinho 15.179.879 17,87

4 23 Ciro Gomes 10.170.666 11,97

5 16 Zé Maria 402.232 0,47

6 29 Rui Pimenta 38.619 0,05

Resultado do 2º turno: nº de votantes = 91.664.259

ordem Número Candidato total votos % válidos

1 13 Lula 52.793.364 61,27

2 45 José Serra 33.370.739 38,73

fonte: www.tse.gov.br => consultas: 1º turno em 21/10/02 e 2º turno em 29/10/02

 

21.050 17.770 

13.730 11.030 

13.786 14.896 

29.05918.161

13.227 17.38317.269

18.226 18.165 

23.266 24597 

27.200 18.900 

78/87 

87-89

89/90 

90/91

91/92 

92/94

94/95 

95/96 

96/97 

97/98 

98/99

99/00 

00/01

01/02 

02/03

03/04

04/05 

  a  n  o  o

  u

  p  e  r   í  o   d  o

área desmatada em km2 

 fonte: www.inpe.br  

Figura 1.2: Desmatamento anual (km2) na Amazônia.

Page 10: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 10/141

 

 

0

500

1.000

1.5002.000

2.500

3.000

  m   2   )

45

1997 1998 1999 2000 2001 2002 2003 2004

ano

   á  r  e  a   d  e  s  m  a   t  a   d  a

   (   k

051015202530

3540

  r  e   l  a  ç   ã  o   A  :   D

   (   %   )

A D A:D (%)

 Fonte: www.ibama.gov.br – sisprof. A = área desmatada com autorização; D = áreadesmatada total e A:D relação entre autorizado e não autorizado.

Figura 1.3: Relação entre áreas (em km2) desmatadas com autorização e sem autorização namazônia.A

 

 

d autorizado20%

PMFS17%

sem origem63%

 Fonte: www.ibama.gov.br – sisprof 

Figura 1.4: Origem da madeira da Amazônia – planos de manejo florestal sustentável(PMFS), desmatamento autorizado e sem origem definida.

Page 11: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 11/141

 

 

3941

3941

4345

46

19 19 19 18 19 20

23,2

12 13 14 15 16 1517,9

15

1214

12 119

12

0

5

10

15

20

25

3035

40

  o   t  o

   (   %   )

45

50

6 a 9/9 14 a 16/9 17 a 19/9 21 a 24/9 28 a 30/9 4 e 5/10 TSE

período da pesquisa

   i  n   t  e  n  ç   ã  o   d  e  v

Lula Serra Garotinho Ciro

 Figura 1.5: Pesquisas de opinião realizadas pelo IBOPE para o 1º turno da eleiçãoresidencial de 2002. p

 

5861

59 58

32 32 31 32

64

6 7

4 3 4 30

10

20

30

40

50

60

70

11 out 18/out 23/out 26/out

data

   i  n   t  e  n  ç   ã  o   d  e  v  o   t  o  s   (   %   )

Lula Serra indecisos nulos/brancos

 

Figura 1.6: Pesquisas de opinião realizadas pelo Datafolha para o 2º turno da eleição presidencial de 2002.

Page 12: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 12/141

 

 

26.000

28.000

30.000

   )

10.000

12.000

   7   8   /   8   7

   8   9

   8   9   /   9   0

   9   0   /   9   1

   9   1   /   9   2

   9   2   /   9   4

   9   4   /   9   5

   9   5   /   9   6

   9   6   /   9   7

   9   7   /   9   8

   9   8   /   9   9

   9   9   /   0   0

   0   0   /   0   1

   0   1   /   0   2

   0   2   /   0   3

   0   3   /   0   4

   0   4   /   0   5

   0   5   /   0   6

14.000

16.000

   á  r

18.000

20.000

22.000

24.000

  m  a   t  a   d  a   (   k

   8   7  -

  e  a   d  e  s

  m   2

ano ou período

área média mínima máxima

IC(95%) = 18.689 ± 2.372 

21.060 

18.689

16.317   Acima = 29%

2005/06? Dentro = 42%

 Abaixo = 29%

 

Figura 1.7: Previsão da área desmatada para 2006 (agosto 2005 a julho 2006) com base nointervalo de confiança (95%) da série histórica de 1978 a 2005.

impreciso preciso preciso

exatoimpreciso preciso preciso

exato

 

Figura 1.8: Diferença entre precisã

 

o e exatidão.

Page 13: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 13/141

 

Capítulo 2Organização dos dados

2.1. Dados:

A informação coletada e analisada pelo estatístico é chamada de DADOS. Há váriosetodologia, pelo estatístico é, parcialmente, determinada pelo

m mãos.tipos de dados e a escolha da mtipo de dados que ele tem e

Exemplo 1: No exame de seleção para turma 90/91 do Manejo Florestal, tivemos 15candidatos, 13 homens e 2 mulheres. Do total, apenas 7 fizeram o exame. Foram aprovados 6candid

ankeados”. No exemplo, as classificações de João e Joaquim são dadosordinai

se refere aos dados mensuráveis e não deve ser confun

éricas ou atributos, taistal, cor de alguma coisa etc.

Dados ordinais: dados sobre classificação, ordem ou “rank”, tais como: classificaçãode toras, orde heg

Dados métricos: dados obtidos de medições de c quanti com po,altu DAP, v e, peso etc.

Um outro importante tipo de d é o cha o DADOS CONTÁVEIS. A contagemdo numero de indivíduos ou itens que caem em rias c ias, ta mo “h ” e“mulher” fornece os dados contáveis. Por exemp a infor dada exemplo anterior que foram apr s 5 ho s e 1 m são da contáv

DADO NTÁ S são dados sobre o número ivíduo itens aemem certas categorias ou classes, que podem ser obtidos de quaisquer tipos de dados(qualitativo, ordinal ou métrico).

Os dados QUALITATIVO e ORDINAL são referidos pelos estatísticos como dadosISCRETOS

atos, 5 homens e 1 mulher. João da Silva tirou o primeiro lugar com nota 6,7 e JoaquimMoreira tirou o último lugar com a nota 5,0.

 No exemplo acima, nós podemos destacar os seguintes tipos de dados:

QUALITATIVO – o tipo mais simples de dados, é a informação que coloca cada

candidato em uma das duas categorias “homem ou mulher” ou “tipo florestal I ou tipo II” ou“estocada ou não estocada” etc. Esses dados dão informações sobre um indivíduo ou um item.

ORDINAL – A informação sobre classificação, dados que colocam os indivíduos ouobjetos em ordem, “r 

s.

MÉTRICO – O termo métricodido com os dados em unidades métricas. No exemplo, as notas dos candidatos (6,7 e

5,0 e outras notas) são dados métricos.

Resumindo:

Dados qualitativos: dados que se referem à qualidade não numcomo: tipo florestal, gênero ou espécie flores

m de c ada etc.

ertas dades o: temra, olum

ados madvá ategor is co omem

lo, mação noovado men ulher, dos eis.

S CO VEI de ind s ou que c

D porque eles classificam coisas em classes separadas e discretas. Nalassificação dos candidatos ao mestrado não há como colocar ninguém entre o primeiro lugar o segundo. Também não há como classificar ninguém entre “homem” e “mulher.” São

xemplos típicos de dados discretos, porque não há como dizer que alguém ficou em primeiro lugar e meio” ou o que fulano é “homem e meio”. No caso de ordem de chegada ourank” há possibilidade de empate, mas isso é outra coisa e será discutido na estatística não-aramétrica.

cee““

 p

 

Page 14: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 14/141

 

Por outro lado, a maioria dos dados métricos é considerada DADOS CONTÍNUOS orque eles envolvem medições sobre uma escala contínua. A escala fica por conta darecisão do aparel na fita á mo que podemoshegar é décimo d AP demos ter DAP’som 20.1, 20.2, ... , 2 cronô rmula 1, no entanto, o nível de precisão é

 pensável para os no ios d

 .2. Dados grupado

A quantidade de dados que pode ser coletada do “mundo-real” é simplesmententástica.

 p p ho de medição:

e cen , ousuta ou na

ntre os Ddiamétrica, o m

’s 20 e 21 cm nósxi

c tímetros seja, e poc 0.9; nos metros da Fó

o.im ssos relóg e puls

2 s:

fa

Exemplo 1: O censo brasileiro. Você já imaginou a trabalheira que dá para cadastrar aproximadamente 180 milhões de pessoas, anotando o nome, sexo, idade, ocupação,escolaridade etc. Apenas para ilustrar, se você usar qualquer software (Excel ou Word) paralistar toda essa gente, você gastará mais de 600 quilômetros de papel apenas para imprimir asinformações básicas, é Manaus-Itacoatiara-Manaus. Com todo esse papel, dificilmente você

teria uma boa fotografia da população brasileira. Então, o que fazem os especialistas doEles nos proporcionamIBGE? variadas informações: quantidades de hom

(X1); X1 por classe idade (X2); X2 por estado e por região; X1 poens e de mulheres

r nível de escolaridade;

os dados.

Exemp

 população ativa etc.

Isso é um exemplo típico da aplicação da estatística DESCRITIVA, por meio daorganização e simplificação d

lo 2: Dados sobre DAP das árvores da parcela-testemunha do bloco 2 (apenas

s” normalmente pensam no DAP em classes de 10, 20, 30, 40 cm etc.

as 40 primeiras árvores).

Os “pica-pau

Para ver quantos DAPs há em cada classe você faz o seguinte:Quadro 2.1. Dados de DAPs de 40 árvores.

árv. nº DAP Árv. nº DAP árv. Nº DAP árv. nº DAP1 25.0 11 33.0 21 32.0 31 37.02 27.0 12 38.5 22 63.0 32 41.03 45.0 13 31.8 23 34.0 33 40.04 36.0 14 52.0 24 30.0 34 32.05 39.0 15 37.0 25 29.0 35 58.06 36.0 16 27.7 26 32.0 36 28.0

7 33.0 17 35.0 27 27.0 37 77.08 47.0 18 33.0 28 28.0 38 58.09 34.0 19 47.0 29 27.0 39 43.0

10 53.0 20 33.0 30 40.0 40 30.0

Page 15: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 15/141

 

Quadro 2.2. Cálculo de freqüência de cada classe de diâmetro.

árvores (f)classes de DAP Contagem nº de  20 < 30 IIIII III 8

30 < 40 IIIII IIIII IIIII IIII 1940 < 50 IIIII II 750 < 60 IIII 460 < 70 I 170 < 80 I 1

total 40

O número de indivíduos (árvores) em cada categoria ou de DAP é chFREQUÊNCIA daquela classe. O quadro 2.2 é uma tabela de distribuição de freqüê

amada dencia. Não

alha com quantidade tão pequena de indivíduos (n = 40, neste

er distribuições de freqüência:

metro.” Outra forma é

e tem que ter a mesma dimensão. Do quadro 2.2, as dimensões são: 20 a

eria continuar, mas isso seria artificial. O propósito de grupar dados é

confundir distribuição de freqüência em estatística com o termo freqüência da EcologiaVegetal. Nem sempre você trabcaso). Com n maiores é mais seguro montar a distribuição de freqüência utilizando a “tabeladinâmica” do Excel – aplicação no Capítulo 17 (Cadeia de Markov).

Algumas “dicas” para estabelec

- o número de classes não deve ser nem muito pequeno e nem muito grande, aocontrário, no meio. Sugere-se um número entre 5 e 12 – regra do “olhôatravés da seguinte fórmula:

n classes ≅ 1 + 3,33 log N (N = número de dados)

- cada class29.9, 30 a 39.9 etc.

- cada pedaço de dados tem que pertencer a apenas a uma única classe.Essa lista pod

distribuí-los em um número razoável de classes de igual tamanho para facilitar a interpretaçãodos mesmos. Se possível, os intervalos que tem uma interpretação natural, devem ser utilizados, como por exemplo: dados em DAP que são normalmente divididos em múltiplosde 10.

0

2

4

6

8

10

12

1416

18

20

Freq

   f  r  e  q   ü   ê  n  c   i  a  a   b  s  o   l  u   t  a

 

Figura 2.1: Histograma de freqüência para os mesmos dados do quadro 2.1.

Page 16: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 16/141

 

A freqüência pode ser também porcentagem ou decimal, conhecidacomo FREQUÊNCIA RELATIV r a freqüência relativa de cadaclasse, bastou dividir a freqüê (número total de indivíduoscontad

 

apresentada emA. No quadro 2.3 para obte

ncia de cada classe por 40os). Se multiplicarmos essas frações por 100, teremos a freqüência em %, caso

contrário, em decimais.

Quadro 2.3. - Distribuição de Freqüência relativa do quadro 2.1.

classes DAP pt médio Freq freq rel freq acum  20 < 30 25 8 0,200 8

30 < 40 35 19 0,475 2740 < 50 45 7 0,175 3450 < 60 55 4 0,100 3860 < 70 65 1 0,025 3970 < 80 75 1 0,025 40

Algumas terminologias:

Classe – uma categoria para o grupamento de dados.

Freqüência – o número de indivíduos ou objetos numa classe. Por exemplo, a

ite inferior é 20.

. No nosso exemplo, o intervalo é 10, ou seja, 30 – 20 =10.

os.

TIVA. Há muitas outras formas de representação gráfica de seus

ados. Hoje em dia, uma forma muito usada é a PIE (torta). De qualquer modo, fique aontade e use de sua imaginação para dar a representação mais conveniente dos seus dados.

freqüência da classe 30-39.9 é 19.

Freqüência relativa – a porcentagem, expressa como um decimal, do número total deindivíduos de uma determinada classe. A freqüência relativa da classe 50-59.9 é 0.1 ou 10%.

Freqüência acumulada – é a soma das freqüências dos valores inferiores ou iguais avalor dado.

Distribuição de Freqüência – a listagem das classes com suas freqüências.

Limite inferior da classe – o menor valor que pode ir dentro de uma classe. Na classe20-29.9 o lim

Limite superior da classe – o maior valor que pode ir dentro de uma classe. Na classe20-29.9 o limite superior é 29.9. Se a precisão fosse de duas casas decimais, o limite superior 

 poderia ser 29.99 e assim por diante.

Intervalo de classe – é a diferença entre o limite superior e o limite inferior de umadada classe

  Ponto médio da classe – é a média aritmética entre o limite superior e limite inferior da classe. Assim, se a classe for: (20+30)/2 = 25. Da classe 30-40 o ponto médio é 35 e assim por diante.

2.3. Gráficos e figuras:

Uma outra maneira de dar sentido a um conjunto de dados é por meio da representaçãográfica dos mesm

  O gráfico mais simples dos dados é o HISTOGRAMA DE FREQUÊNCIA. A alturade cada barra é igual a freqüência que ela representa. Tem também o HISTOGRAMA DEFREQUÊNCIA RELA

dv

 

Page 17: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 17/141

 

Capítulo 3

çados, para a descrição sucinta dos fenômenossticas usadas na estatística, para descrever as

variáveis aleatórias, em populações particulares, caem em uma das três categorias: (1)medidas da tendência central (alocação de um valor ordinário); (2) medidas de dispersão(distância relativa de valores extremos de um valor central); (3) medidas de relacionamentoentre a variávei imilaridade ou dissimilaridade em magnitude).

de gráficosgrupamento de dados são úteis no manuseio de um grande conjunto de dados. Uma outrarma de sumarizar os dados é por meio da computação de um número, tal como a média, a

qual su

3.1 Medidas de tendência central:

mediana.Menos harmônica.

enteusada de todas as medidas estatísticas.

idade) dividida pelo nú de amostra paraamostr ais desejáveis emonexão com as distribuições de probabilidade.

crescente ou

decresc m amostras comnúmero lores que estão“rankeados” no meio. Estimativas da mediana de pequenas amostras não são muito

classe com a maior 

imento pense na mediana como o 50-ésimotil.

a raiz de um produto de n valores, ou antilog da médiaritmét a dos to de valores e é sempre tão pequeno ou menor que a médiao mes o con

Medidas descritivasHá muitos critérios, por sinal, bem avan

naturais. Apesar disso, a maioria das caracterí

s s (grau de s

Em geral, o volume de dados de uma pesquisa é muito grande. Os métodosefo

 bstitui um grande volume de dados por um simples número.

As medidas de alocação mais comumente utilizadas são média aritmética e afreqüentemente usadas são: moda, percentil, média geométrica e média

A média comum ou média aritmética ou simplesmente média, é a mais freqüentem

Média – é simplesmente a soma de todas observações (DAP, altura,mero total de observações. É a medida que tem a menor variabilidade

a, é fácil de ser manuseada matematicamente e tem as propriedades mc

  Mediana – é o valor de uma variável aleatória que, em ordem

ente, está “rankeado” no meio, entre os valores maiores e menores. Epar de observações, a mediana é a média aritmética dos 2 va

confiáveis.

Moda – é o valor mais freqüente, ou seja, é a categoria oufreqüência. É uma medida fácil e rápida de ser obtida, mas, por outro lado, fica sempre sujeitaa variação extrema de uma amostra para outra, ao menos que a amostra seja bem grande.

Percentil – para um melhor entend percen

Média geométrica – é a n-ésima ic logs de um conjund m junto de dados.

Média harmônica – é a recíproca da média de um conjunto de dados recíprocos e étão pequena ou menor que a média geométrica para um mesmo conjunto de dados.

Para dados ordinais, é preferível utilizar-se da mediana, apesar de que a média é, asvezes, utilizada.

Para dados métricos pode ser usada a média ou a mediana. Como com dados ordinais,a mediana é preferida para propósitos descritivos. A maioria das teorias estatísticas para dadosmétricos usa a média.

Page 18: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 18/141

 

Computação de Média, Mediana e Moda

Média – a estimativa da média,  x _ 

ou ӯ, do parâmetro µ, é obtida da seguinte maneira:

Dos dados do quadro 2.1, a média será:

40)x....xx( 4021 x

+=

   x _ 

= 38,225

Mediana – do qua é preciso ordem crescente,

(1ª) (2) (3) (4) (5) (6) (7) (8) (9) (10)

25 27 27 27 27.7 28 28 29 30 30

(11) (12) (13) (14) (15) (16) (17) (18) (19) (20)

36 36 37 37 38.5 39 40 40 41

vações, n, é par, a mediana será a média aritméticados vigésimo e ig es, ou seja, (34 + 35)/2 = 34.5.

Moda édio da classe que tem a maior freqüência, que nonosso caso, quadro 2.2, é 35, que tem a freqüência = 19.

= 35,0

Interpretação:

dro 2.1, primeiro ordenar em

 

31.8 32 32 32 33 33 33 33 34 34

(21) (22) (23) (24) (25) (26) (27) (28) (29) (30)

35

(31) (32) (33) (34) (35) (36) (37) (38) (39) (40ª)

43 45 47 47 52 53 58 58 63 77

 Neste caso, o número total de obser v ésimo-primeiro valor 

 – é simplesmente o ponto m

Resumo das estimativas das medidas:

Média = 38,225

Mediana = 34,5

Moda

um conjunto de dados pode ter mais de uma moda, mas sempre terásomente uma média ou mediana. Como você pode ver, de um mesmo conjunto de dados, vocêtem diferentes medidas de tendência central. Qual delas é a melhor? A decisão vai depender,

 principalmente, do objetivo de sua informação. Quando a gente vende madeira em volume,normalmente truncada a um determinado diâmetro mínimo, a média deve prevalecer tendo emvista a maior facilidade para os cálculos posteriores. Se a árvore é vendida em pé, a moda

 pode ser mais interessante, porque ela dá uma noção também da distribuição de freqüência. A

utilização da mediana é mais prática na tomada de decisões quanto a tratamentossilviculturais, desbastes etc., quando você precisa priorizar o tamanho que precisa sofrer intervenções.

Page 19: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 19/141

 

3.2. M 

nu

edidas de dispersão:

Uma medida de dispersão é um número usado para mostrar quanto de variação existem conjunto de dados.

Até agora discutimos somente as medidas de tendência central. Entretanto, 2 conjuntos

de dados podem ter a mesma média ou a mesma mediana e, mesmo assim, ser bastantediferente.

Exemplo 1: Dois conjuntos de dados (turmas de Manejo e Ecologia), no quadro 3.1

Quadro 3.1. Idades de alunos dos cursos de manejo e ecologia do INPA

Manejo ) Ecologia(CFTde aluno idadealuno ida

1 1 22252 28 2 303 30 3 28

4 29 4 215 28 5 39média 28 média 28

As médias dos dois grupos são iguais. No edois grupos diferentes em idade. Dá para pe

ntanto, é claro que estamos nos referindo aais uniforme

em term o que há dentro de cada conjunto de dados,  podemos usar a amplitude total ou o desvio padrão, as duas medidas de dispersão maiscomuns.

tre oaior e o maior e

o menAlém d do uma medida que depende apenas dos valoresexternos, é instável, não sendo afetada pela dispersão dos valores internos.

Do quadro 3.1, as amplitudes são:

ação é freqüentemente simbolizado pela letra grega minúscula (σ).

Dificilmente a gente trabalha com o parâmetro. Entretanto, dado uma amostra de valoresa população, podemos fazer uma estimativa de σ que é comumente

mbol

rceber que o grupo do Manejo é mos de idade. Neste caso, para ver a variaçã

AMPLITUDE TOTAL – é a medida da variação olhando apenas a diferença enm o menor valor. Esta medida é de fácil computação porque depende apenas d

d or valor, mas, em compensação ela não diz o que acontece entre esses dois valores.isso, é considerada muito limita, sen

-  Manejo: 30 – 25 = 5

-  Ecologia: 39 – 21 = 18

DESVIO PADRÃO – nos dá a dispersão dos indivíduos em relação à média. Ele nosdá uma idéia se os dados estão próximos da média ou muito longe. O desvio padrão dosindivíduos de uma popul

individuais de umsi izada por  s.

1-n

)x - (x 

s :Fórmula

n

1i

2i

± =

1-ns :simples ais1 1i

n/))x(( - xn

2i

2i∑ ∑

n

m,= =

ou ±=i

 

Page 20: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 20/141

 

 x _ 

Por que o denominador é (n-1) em vez (n)? Porque os n desvios, (xi – ), são

ente conectados pela relação linear  ∑ ( xi –  x _ 

) = 0. Se você especifica o valor danecessariam

 x _ 

e os ( n-1 ) valores de xi, então o valor do último xi é fixo; isto é, é uma informação

édia amostral  x

 _ 

redundante. Por esta razão, ao usar a m em vez da média da população µ s, você perde um grau de liberdade (gl) e a estimativa deé dita ter ( n – 1 ) gl associados com ela. O uso de (n – 1) em vez de (n) no cálculo de s  bém fornece uma estimativa não-tendenciosa; isto é, em uma série infinita de amostras

édio do estimador é igual a σ.

como um ponto central no cálculo deσtamaleatórias, o valor m

Os desvios padrões dos dados do quadro 3.1 são:

Manejo: s = ± 1.87

Ecologia: s = ± 7.25

-

-

Resumindo: quanto maior a variação den o

os agora, que apesar dos dois terem

tr de um conjunto de dados, maior será o

desvio padrão. Do exemplo 1 nós constatam as mesmasedida ana, as medidas de dispersão são totalmente

nejo é mais homogêneo em idade, comprovadaela m

Cálculo da média e desvio dos dados grupados:

eguinte maneira:

m s de tendência central, média e medidiferentes. Isto quer dizer que o grupo de Ma

 p enor variação encontrada.

A média é calculada da s

 x _ 

= ( ∑ xi * f i ) / n

onde: xi = ponto médio da classe, f i = freqüência de cada classe e n = número de classes

E o desvio padrão segue o mesmo princípio da média em relação às classes.

Do quadro 2.2, essas medidas serão:

 x _ 

= 38,5 e s = ± 11,45

3.3. M 

mais) variáveis aleatórias, independente das

s serão vistas, em detalhe,um ca

s já vimos um exemplo de percentil. A mediana divide um conjunto de dados em

quarto da área total.

edidas de relacionamento:

As medidas mais comumente utilizadas para relacionamento são correlação eregressão. Vários tipos de correlação podem ser usados para medir o grau de associação(similaridade ou dissimilaridade) entre 2 (ou

unidades de medida e mudanças lineares em escala. Estas medidan pítulo específico.

3.4 Percentil:

 Nóduas partes, 50% de um lado e 50% de outro, depois de colocá-los em ordem crescente. Por esta razão ela se refere ao qüinquagésimo percentil de um conjunto de dados. Além dos

 percentils, que pode dividir os dados de acordo com qualquer valor percentual, o pesquisador  pode também querer encontrar o quartil e o decil.

Quartil é a separatriz que divide a área de uma distribuição de freqüência em

domínios de área igual a múltiplos inteiros de um  Decil é a separatriz correspondente ao valor do argumento que divide a distribuiçãonuma razão decimal.

Page 21: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 21/141

 

Exemplo: dados do quadro 2.1 em ordem crescente.

Primeiro quarto

2 27 27 27

Segundo quarto

3 32 32 32 33 33

Terceiro quarto

Computações:

Primeiro quartil = (30 + 31.8) / 2 = 30.9

Segundo quartil = (34 + 35) / 2 = 34.5

Terceiro quartil = (41 + 43) / 2 = 42.0

3.5. Considerações finais:

  Neste capítulo não poderíamos deixar de mencionar três outros conceitos muitoimportantes na nossa área de conhecimento, coeficiente de variação, variância e covariância.

COEFICIENTE DE VARIAÇÃO – é a razão entre o desvio padrão e a média. Elenos dá uma idéia de variação relativa de nossa população, permitindo a comparação de 2

 populações diferentes independentes das unidades de medida.

Do quadro 3.1, estimamos as médias (28 para manejo e 28 para Ecologia) e os desvios padrões (1.87 e 7.25). Agora temos os coeficientes de variação (CV):

CV = 1.87/28 = 0.0668 ou 6.68 % - Manejo

CV = 7.25/28 = 0.2589 ou 25.89 % - Ecologia

Do nosso exemplo do quadro 2.1, temos uma população de árvores, com as seguintesestimativas: média = 38,225 e desvio = 11,28

CV = 11,28/38,225 = 0.2951 ou 29,51 % - floresta ZF-2

Mesmo se tratando de populações diferentes podemos concluir com base nos CVs: A  população Manejo é mais homogênea e a mais heterogênea é a floresta da ZF-2. Isto é  possível porque o CV é uma medida relativa, que independente da unidade de medidautilizada.

VARIÂNCIA - Variância é uma medida da dispersão dos valores unitáriosindividuais em torno de sua média. A variância não só parece com o desvio padrão, como é o

 próprio, apenas “ao quadrado” . Se você tirar da fórmula do desvio, a raiz quadrada, você tema fórmula da variância. Por que “ao quadrado”? Simplesmente porque a soma de todos os

desvios tem que se anular, tendendo a zero e, daí, você não teria condições de ver a amplitudede variação dos seus dados em relação à média.

5 27.7 28 28 29 30 30

1.8 33 33 34 34

39 40 40 41

3 45 47 47 52 53 58 58 63 77

35 36 36 37 37 38.5

Quarto quarto

4

 

Page 22: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 22/141

 

  COVARIÂNCIA - é umrelacionamento (covariabilid

a medida de como 2 variáveis variam juntas, emade). Suponha duas variáveis x e y. Se os maiores valores de x

nde a ser associados com os maiores valores y, nós dizemos que a covariância é positiva.ando os maiores se associam com os menores, ou vice-versa, a covariância é negativa.

a zero.

Variância, s2 = SQCx /(n-1)

Covariância, s SPC / (n-1)

SPC = Soma dos Produtos Corrigidos

teQuQuando não há uma associação particular de x e y, a covariância tende

As fórmulas são:

xy = xy

S

SQC = Soma dos Quadrados Corrigidos

endo:

Page 23: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 23/141

 

Fórmulas úteis

Média Aritmética Variância

n

 x

 x i

i∑n

== 1 

)(

112

−=

∑2

=

n

n

 x x

s i

i

 

Desvio padrão Erro padrão

2ss ±= nss /= x  

2 2

∑ −= i xn

 x  

∑ ⎟ ⎞

⎜⎛ 

n

n

 x2

=

= ⎠⎝ 

i

i

i

SQC 1

1

n ySQC 

i

i y

12 −= ∑  

 yn

⎟ ⎞

⎜⎛ ∑ in

i 1

 ⎠⎝  =

=

 

) )n

 y xSPC i

ii xy

 y x iin ∑∑−= ∑=1

 

Coeficiente de correlação

Y  X 

 xy

SQC SQC 

SPC r 

×=

 

Page 24: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 24/141

 

Capítulo 4Probabilidade

a população baseada em umaamostra da população.

Desde que a estatística de inferência envolve predições (educadas), é sempre possívelzer uma inferência incorreta. É preciso saber o quanto a nossa inferência está correta. Paraedir a chance de estar certo na nossa inferência estatística, precisamos entender a teoria de

clássicos de “cara & coroa”, dos dados e do jogo de baralho. A propósito, a teoria foidesenvolvida por causa de jogos de azar. O objetivo deste capítulo é dar uma base geral parafacilitar o entendimento da aplicação de testes de hipóteses, paramétrica e não-paramétrica.

O processo de computação (cálculo) de probabilidades depende de sua capacidade decontar, “1, 2, 3 e assim por diante.” A seguir vamos discutir alguns métodos de contagem.

4.1. Contagem:

testes (tentativas); se a moeda é jogada uma vez, ouimento deve ser considerado um experimento.

teste, vários testes ou de todo oexp im

RE

No capítulo 1 nós distinguimos dois tipos de estatísticas: descritiva e de inferência. Aestatística descritiva envolve a organização e a sumarização dos dados. A estatística de

inferência lida com inferências (predições educadas) sobre um

fam

 probabilidade, que é a fundamentação matemática para a estatística de inferência.

Para entender os princípios da teoria de probabilidade não há como fugir dos exemplos

Primeiro vamos estabelecer as seguintes definições dentro da teoria de probabilidade.

Resultado - no caso de “cara ou coroa”, 2 resultados são possíveis e no caso do jogo dedados, 6 resultados.

Teste - (ou tentativa) - é a ação de jogar a moeda e ver se ela cai com a cara oucoroa.

Experimento - é o conjunto deduas, ou n vezes, não interessa – o proced

Eventos - são os possíveis resultados de umer ento. Exemplo de evento: “uma coroa em 4 jogadas” ou “pelo menos um é cara”.

GRA 1: Se um experimento consiste de n testes, onde cada teste pode resultar em um dosk p sí o.os veis resultados, afirmamos que há k possíveis resultados de todo o experimentn

Exemplo 1: no jogo da moeda você tem dois resultados, cara (C) ou coroa (c), k=2.Se você jogar apenas uma vez, n=1, você terá 21 = 2 possíveis resultados, C ou c. Se você

 jogar duas vezes, n = 2, você terá 22 = 4 possíveis resultados, CC  cc Cc cC.

REGRA 2: Há n! (fatorial) maneiras de arranjar n objetos distinguíveis em uma seqüência.

Exemplo 2: considere o número de maneiras de arranjar as letras A, B e C numaseqüência. A primeira letra pode ser qualquer uma das três, a segunda pode ser escolhida deduas maneiras diferentes uma vez que a primeira já foi escolhida, e a letra remanescente setorna a última letra escolhida, para um total (3) (2) (1) = 6 ou 3! Arranjos diferentes. Os 6

 possíveis arranjos são: ABC ACB BAC BCA CAB e CBA.

Exemplo 3: suponha uma corrida de cavalos com 8 cavalos. Há 8 maneiras dequalqu outro. Se

você q

er um deles chegar em primeiro lugar, tendo nas outras colocações qualquer 

uiser saber quantos arranjos são possíveis tendo, no primeiro e segundo lugar, qualquer um deles e, as demais colocações, de qualquer jeito, você fará (8) (7) = 56 arranjos. Se você,

Page 25: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 25/141

 

no entanto, quiser saber todos os possíveis arranjos do primeiro ao oitavo lugar você fará 8! =40320 arranjos.

REGRA 3: se um grupo de n objetos é composto de k objetos idênticos de um tipo e orestante (n-k) são objetos idênticos de um segundo tipo, o número de arranjos distinguíveisdos n objetos numa seqüência, denotado por meio de

Ou: se

k)!-(nk!

n! 

n por dadoé 

n=⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

 

um grupo de n objetos é composto de n1 objetos idênticos do tipo 1, n2 objetos idênticos do tipo 2, ..., nr  objetos idênticos do tipo r, o número de arranjos distintos numaseqüência será:

nr! ... n2! n1!

n! 

ni

n por dadoé

ni

n=⎟⎟

 ⎠

 ⎞⎜⎜

⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜

⎝ 

⎛ 

3 (1) )1( )2(

(1) (2) (3) 

1! 2!

3! 

2

3===⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

Exemplo 4: no exemplo 2 listamos as 6 maneiras de arranjar as letras A, B e C numaüên

4.2. D

seq cia. Suponha agora que as letras A e B são idênticas e chame-as de X. Assim, osarranjos ABC e BAC se tornam indistintos, XXC para os dois. Também ACB e BCA setornam XCX. O arranjo original é reduzido para arranjos distintos, que são XXC, XCX eCXX.

efinições de probabilidade:Primeiro vamos ver algumas definições:

(i)    Espaço amostral   - é a coleção de todos os possíveis resultados de umexperimento.

(ii)  Ponto no espaço amostral  - é um resultado possível de um experimento.

ostral, que consiste essencialmente deento. O espaço é subdividido e

esultado é representado por um ponto e somentem pon

Cada experimento tem o seu próprio espaço amde um experimuma lista de diferentes resultados possíveis

cada subdivisão é um ponto. Cada possível r u to.

Exemplo 1: se um experimento consiste em jogar duas vezes a moeda, o espaçoamostral consiste de 4 pontos CC cc Cc cC.

Exemplo 2: uma prova consistindo de 10 questões “falsa” ou “verdadeira” é passadaum aluno como um experimento. Há 210 = 1024 pontos no espaço amostral, onde cada ponto

consiste da seqüência das possíveis respostas para as 10 questões sucessivas, tais como:FFFFVVFFVV.

gora, então, é possível definir evento, em termos dos pontos do espaço amostral.

tral.

caras”, estamos nos referindo a umCC; o evento “uma cara” consiste de dois pontos Cc e cC; o evento “peloa” consiste de três pontos CC, Cc e cC.

a

A

(iii) Evento - um evento é qualquer conjunto de pontos no espaço amos

  No exemplo 1 ao falarmos do evento “duassimples pontomenos uma car 

 

Page 26: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 26/141

 

Dois diferentes eventos podem ter pontos comuns e ambos. Os eventos “pelo menosuma cara” e “pelo menos uma coroa” tem os pontos Cc e cC em comum. Se dois eventos nãotêm pontos em comuns eles são chamados de eventos mutuamente exclusivos porque aocorrência de um evento automaticamente exclui a possibilidade de ocorrer outro evento aomesmo tempo.

Para cada ponto no rrespondente chamado de  probabilidades podem ser 

evento inclui a definição

associadas com um particular espaçoe acordo com as

espaço amostral há um número co  probabilidade do ponto ou probabilidade do resultado. Estasquaisquer números entre 0 a 1. A definição da probabilidade de umda probabilidade de um resultado como um caso especial, desde que o evento possa ser considerado como que se consistisse de um resultado simples.

  Na prática, o conjunto de probabilidadesamostral é raramente conhecido, mas as probabilidades são atribuídas dnoções pré-concebidas do pesquisador, isto é, o pesquisador formula um modelo como umaversão ideal do experimento. Então, o espaço amostral do modelo experimental é examinado eas probabilidades são atribuídas aos vários pontos do espaço amostral de alguma maneira que

o pesquisador sinta que pode ser justificada.Exemplo 3: Num experimento consistindo de uma única jogada de uma moeda “não

viciada”, é razoável assumir que o resultado cara (C) tem metade da chance de ocorrer.Assim, podemos atribuir a probabilidade de ½ para o resultado C e o mes

aneira: P (C) =1/2 e P (c) = 1/2 .mo para c. Isso pode

ser escrito da seguinte m

Exemplo 4: Num experimento consistindo de 3 jogadas (testes), é razoável assumir que cada um dos 2

 

3 = 8 resultados CCC CCc CcC Ccc cCC ccC cCc ccc tem a mesmachance de ocorrer. Assim, a probabilidade de cada resultado é 1/8. Também P (3 caras) = 1/8,P (pelo menos 1 cara) = 7/8, P (pelo menos 2 caras) = 4/8 = ½.

(iv) Função de Probabilidade: é uma função que atribui probabilidades aos várioseventos no espaço amostral.

Várias propriedades dessas funções são aparentes. Considere S como espaço amostrale A, B

onde P (B) > 0, caso contrário, é indefinido.

Exemplo 5:

ou C como qualquer evento em S. Então, se P é a função de probabilidade, P(S) = 1,P(A) > 0 e P(a) = 1 – P(A), onde a é o evento “o evento não ocorre”.

(v) Probabilidade Condicional: é a probabilidade de ocorrer A dado B.

P (A | B) = [ P (AB) ] / [ P (B) ]

Considere o jogo de dados, tal que cada um dos 6 possíveis resultados

tem a probabilidade de 1/6 de ocorrer. Como antes, deixe A ser o evento “a ocorrência de 4, 5ou 6” e B o evento “a ocorrência de um número par” . Então P (AB) = P (4 ou 6) = 2/6 = 1/3.

robabilidade condicional P (A|B) é dada por 

) P (B)

Também, P (B) = 3/6 = ½. Então, a p

 

3/2 2/1

3/1 B)|(AP ==

 

(vi) Eventos independentes:  Dois eventos A e B são independentes se

(1) P (AB) = P (A

 

Page 27: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 27/141

 

Exemplo 6:   Num experimento consistindo de 2 jogadas de moeda, os 4 pontos no espaçoamostral assumem ter a mesma probabilidade. Deixe A ser o evento “uma cara ocorre na

 primeira jogad e corre segund tão A tem os pontos CC e C o em o os CC ) = 2/4, P (B)= 2/4 e P (AB) = 1/4.

P (AB) = (2/4) (2/4) = 4/16 = 1/4

satisfaz a condição (1 , por esta razão, A e B são independentes.

(vii)  Experim tos Mutuamen ndepende ão mutu independentes sedos os conjuntos de eventos formados tiverem a seguinte equação com verdadeira:

nde A

a” e B ser o evc. B tem os pont

nto “uma cara os CC e . AB t

na a jogada.” En. Ta P (AcC s pont mbém

) e

enn

te I ntes: s amenteoto

P ( A1, A2, ..An) = P (A1) P(A2) ...P (An)

o i representa um resultado do i-ésimo experimento para i = 1, 2, ....n.

Exemplo 7: Considere um experimento com 1 jogada da moeda, onde o evento C tema probabilidade p e o evento c tem a probabilidade q = 1 – p. Considere 3 repetições

c2 C3) = P (C1) P (c2) P (C3) = pqp

ade de obter “exatamente k caras” , então, é igual aormo

independentes do experimento, onde o subscrito será usado para diferenciar o experimentocom o qual o resultado está associado. Dessa maneira, C1 c2 C3 significa que o primeiroexperimento resultou em C, o segundo em c e o terceiro em C. Por causa de nossa hipótese deindependência,

P (C1 

Se considerarmos o evento “exatamente 2 caras” associado aos experimentoscombinados, o seguinte pode ocorrer 

ementeconseqüentemaneiras3 2

2

3==⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

q3p caras)2exatamente(P 2=

Obviamente o anterior pode ser descrito simplesmente como um experimento com 3tentativas independentes. Por extensão, podemos considerar um experimento consistindo de n 

  jogadas independentes. A probabilidte pk qn - k  vezes o número de vezes que o termo pode aparecer. Por esta razão, em n

 jogadas independentes de uma moeda

onde p = P(C) em qualquer jogada.

Outras considerações:  Conceito de probabilidade usando distribuições defreqüências relativas.

Exemplo 8: Um diretor de e

 ⎠⎝ 

k -nk q pk 

n caras)k e(exatamentP

⎟⎟

 ⎞

⎜⎜⎛ 

=

scola numa pequena cidade de 40 famílias classificoucada família de acordo com o número de crianças (menores que 18 anos). As informaçõesobtidas são sumarizadas no quadro 4.1.

Page 28: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 28/141

 

Quad

nº de famílias % freq. relativa

ro 4.1: Distribuição de número de crianças por família.

nº de crianças0 18 45,0 0,4501 8 20,0 0,2002 7 17,5 0,1753 4 10,0 0,1004 3 7,5 0,075

40 100,0 1,000

O quadro 4.1 mostra, por ex., que 17,5% (0.175) das 40 famílias possuem 2 crianças.

e acordo com o número de crianças na família. Desde que “o número de crianças” varia demília de variável. Quando selecionamos uma família

uma variável aleatória desde que o seu valor (um

  Definição 1:

Agora, suponha que uma das famílias tenha sido selecionada aleatoriamente, ou seja,cada família teve igual chance de ser escolhida. Qual é a probabilidade que a famíliaselecionada tenha 3 crianças? A resposta é 4/40, que é a mesma frequência relativa.

Suponha que há N resultados possíveis num experimento. A probabilidade que umevento ocorra é o número de vezes, f , que o evento pode ocorrer, dividido pelo número total,N, de possíveis resultados.

4.3. Variáveis aleatórias:

 No exemplo 8 nós vimos um levantamento que classificou cada uma das 40 famíliasdfa para família, ela é chamada

ente o “núaleatoriam , mero de crianças” énúmero real) depende de uma chance.

Uma variável aleatória é uma função que atribui números reais aos pontos num espaço amostral.

As variáveis aleatórias são normalmente representadas pelas letras maiúsculas X, W,úmeros reais atribuídos pelas variáveis aleatórias serão

represe

  Exemplo 1:

 Y ou Z com ou sem subscritos. Os n

ntados por letras minúsculas.

 Num experimento onde ao consumidor é dada a chance de escolher 3  produtos, sabonete, detergente ou marca A, o espaço amostral consiste dos 3 pontosrepresentando as 3 possíveis escolhas. Deixe a variável aleatória atribuir o número 1 para ascolha “marca A” e o número 0 (zero) para os outros 2 possíveis resultados. Então, P(X = 1)

or escolher a marca A.

Exemplo 2:

eé igual a probabilidade do consumid

Para 6 meninas e 8 meninos é perguntado se eles se comunicam maisfacilmente com suas mães ou com seus pais. Deixe X ser o número de meninas que pensamque se comunicam melhor com suas mães e deixe Y ser o número total de crianças que

 pensam que se comunicam melhor com suas mães. Se X = 3, nós sabemos que ocorreu oevento “3 meninas pensam que se comunicam melhor com suas mães.” Se, ao mesmo tempo,Y = 7, nós sabemos que ocorreu o evento “3 meninas e 7 – 3 = 4 meninos pensam que secomunicam melhor com suas mães.”

Se X é uma variável aleatória, “X = x” é uma notação simplificada que usamos paracorresponder ao mesmo evento no espaço amostral, especificamente o evento que consiste do

conjunto de todos os pontos para os quais à variável X foi atribuído o valor “x”.Exemplo 3: Num experimento consistindo de 2 jogadas de moeda, deixe X ser o

número de caras. Então, X = 1 corresponde ao evento contendo os pontos Cc e cC.

Page 29: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 29/141

 

Dessa maneira, “X = x” é, às vezes, referida como o “evento X = x,” quando, narealidade, pretendeu-se dizer “o evento consistindo de todos os resultados atribuídos o númerox pela variável aleatória X.”

Por causa desta estreita correspondência entre variáveis aleatórias e eventos, asdefinições de probabilidade condicional e independência se aplicam igualmente bem àsvariáveis aleatórias.

  Definição 2: A probabilidade condicional de X dado Y, P (X = x | Y = y), é a probabilidade que a variável aleatória X assume o valor x, dado que a variável aleatória Y jáassumiu o valor y.

0y)P(Y se y)P(Y

y)Yx,(XP y)Y|xP(X (1) >=

=

=====

  Exemplo 4: Deixe X ser o número de meninas que se comunicam bem com suasmães, das 6 meninas entrevistadas, como no exemplo 2 e deixe Y ser o número total decrianças que se comunicam bem com suas mães. Por conveniência, deixe Z=Y-X, tal que Z éigual ao de meninos, dos 8 entrevistados, que se comunicam bem com suas mães. Assuma queas respostas dadas pelas crianças são independentes de cada outra e que cada criança tem amesma probabilidade p (desconhecida) de dizer que se comunica bem com a sua mãe.Encontre a probabilidade condicional P ( X=3 | Y=7).

Primeiro, pelas suposições anteriores, X=3 e Z=4 são eventos independentes. Desdeque o evento (X=3, Y=7) é o mesmo que o evento (X=3, Z=4), temos a probabilidade

P(X=3, Y=7) = P(X=3, Z=4)= P(X=3) P(Z=4)

or c

 

4433  p)-(1 p4

  p)-(1 p3

 (2) ⎟⎟ ⎠

⎜⎜⎝ 

⎟⎟ ⎠

⎜⎜⎝ 

= 86 ⎞⎛  ⎞⎛ 

 p ausa do exemplo 7 do item 4.2.

Pelo mesmo exemplo, concluímos que

tal que a probabilidade condicional

77  p)-(1 p7

14 7)P(Y (3) ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ==

 

Page 30: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 30/141

 

 

vComo os pontos no espaço amostral são mutuamente exclusivos, os valores que uma

ariável aleatória pode assumir são também mutuamente exclusivos. Para um simples

  junto de valores que uma variável aleatória pode assumir tem as mesmasres individuais assumidos pela variável aleatóriatral, um conjunto de valores corresponde a um

evento e a probabilidade da variável aleatória assumir qualquer valor dentro de um conjuntode valores é igual a soma das probabilidades associadas com todos os valores dentro doconjunto. Por exemplo:

eros a e b,

onde o som x que são pares. Por causa dessa similaridadeentre o conjunto de valores possíveis de X e um espaço amostral, a descrição do conjunto de

es associadas com os vários valores que X pode assumir, é freqüentementehamado de função de probabilidade da variável aleatória X, assim como um espaço amostral

a variável

espaço amostral, asrobab res de X são conhecidas e a função de

resultado de um experimento, a variável aleatória é definida por apenas um número. Assim,todo o con  propriedades do espaço amostral. Os valocorrespondem aos pontos no espaço amos

 

onde o somatório se estende a todos os valores de x entre, não incluindo os núm

 

atório se aplica a todos os valores de

 probabilidadctem uma função de probabilidade. Entretanto, a função de probabilidade de umaleatória não é uma atribuição arbitrária de probabilidades, como é a função de probabilidade

 para um espaço amostral. Isto porque uma vez que as probabilidades são atribuídas aos pontosnum espaço amostral e uma vez que a variável aleatória X é definida no

  p ilidades associadas com os vários valo probabilidade de X é, dessa maneira, já determinada.

  Definição 3: A função de probabilidade da variável aleatória X, usualmente

u

representada por f(x) ou de outra maneira qualquer, é a função que dá a probabilidade de Xassumir o valor x, para qualquer número real x, ou seja,

x) P(X f(x) (5)

Vimos até aqui que a distribuição de probabilidades associadas com uma variávelaleatória pode ser descrita por uma função de probabilidade. Uma outra maneira de dizer a

esma coisa é através de uma função de distribuição que descreve as probabilidadesmacum ladas.

==

0.408 14!

4)!-(84! 

3)!-(63!  =

 ⎞⎛ 

⎟⎟ ⎠

⎜⎜⎝ 

⎟⎟ ⎠

⎜⎜⎝ =

7)!-(147!

 

7

14 7)

⎟⎟ ⎠

⎜⎜⎝ 

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ 

4

3

6

Y|3P(X )4(⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

==⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

=

8!6! ⎞⎛  ⎞⎛ 

 x)P(X  b)X(aP bxa

∑ ==<<<<

∑ === par x

x)(XP  par)número(XP

 

Page 31: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 31/141

 

    Definição 4: A função de distribuição de uma variável aleatória, usualmenterepresentada por F(x), é a função que dá a probabilidade de X ser menor ou igual a qualquer número real x, ou seja,

onde o somatório se estende a todos os valores de t que não forem superiores a x.

  Definição 5: Deixe X ser uma variável aleatória. A distribuição binominal é adistribuição de probabilidade representada pela função de probabilidade

A função de distribuição será então

onde: n é número inteiro positivo, 0 ≤ p ≤ 1 e q = 1 – p. Note que usaremos a convenção usualque 0! = 1.

onde o somatório se estende a todos os possíveis valores de i menor ou igual a x. Há tabelas prontas para alguns valores selecionados dos parâmetros n e p.

Exemplo 5: Um experimento com n testes independentes, onde cada teste podee P e q,spect tão, comoostra e

 

 para x neira, o experimento tem a distribuição binominal.

resultar em um dos dois resultados “sucesso” ou “insucesso,” com probabilidadivamente. Deixe X ser igual ao número total de “sucessos” nos n testes. Enre

m do na quação (7),

∑≤xt

n..,0,1, x para q px

n x)P(X f(x) )7( x-nx =⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ===

i-ni

xi

q pi

n x)P(X F(x) )8( ∑

≤⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ =≤=

x ⎠⎝ 

=≤= f(t) x) (XP F(x) )6(

x-nxq pn

 x)(XP ⎟⎟ ⎞

⎜⎜⎛ 

==

inteiro de 0 a n. Desta ma

 Definição 6:  Deixe X ser uma variável aleatória. A distribuição discreta uniforme é adistribuição de probabilidade representada pela função de probabilidade.

(9) f(x) = 1/N para x = 1,2, ... , N

esta maneira, X pode assumir qualquer valor inteiro de 1 a N com igual

plo 6:

D probabilidade, se X tem a função de probabilidade discreta uniforme.

Exem Há em um saco N papeletas numeradas de 1 a N. O experimento consiste

apeletas que podem ser tiradas. Deixe X ser igualo número da papeleta tirada. Então X tem a distribuição uniforme discreta.

de tirar uma papeleta do saco, onde cada papeleta tem a mesma chance de ser tirada. O espaçoamostral tem N pontos, representando as N pa

   Definição 7: A função de probabilidade conjunta f (x1, x

2, .. x

n) das variáveis

de X1 = x1, X2 = x2, ... , Xn = xn.

(10)  f(x1, x2, .. xn ) = P (X1 = x1, X2 = x2, ... , Xn = xn )

aleatórias x , x , .. x é a probabilidade da ocorrência conjunta1 2 n

Page 32: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 32/141

 

   Definição 8: A função de distribuição conjunta F(x1, x2, .. xn ) das variáveis

aleatórias x1, x2, .. xn é a probabilidade da ocorrência junta de X1 ≤ x1, X2 ≤ x2, ... , Xn ≤ xn .

xn )

Exemplo 7:

(11) F(x1, x2, .. xn ) = P (X1 ≤ x1, X2 ≤ x2, ... , Xn ≤

Considere as variáveis aleatórias X e Y como definidas no exemplo 2.

onde

onde o somatório na equação (13) se estende a todos os valores de x e y tal que x ≤ 3 e y ≤ 

ser avaliadas sem conhecer o valor de p.

Considere f(x,y) e F(x,y) como as funções de probabilidade conjunta e de distribuição,respectivamente.

77  p)-(1 p4

3

6 7)Y3,(XP 7)f(3, )12( ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ====

 e

e7, com a usual restrição de que x e y – x são inteiros não negativos. Note que as equações (12)

e (13) não podem   Definição 9: A função de probabilidade condicional de X dado Y, f(x | y) é

(14)  f(x | y) = P(X = x | Y = y)

Da equação 1 vemos que

ta de X e Y e f(y) é a função de probabilidadede Y e

 

∑≤≤≤≤=≤≤=

7yx3x0 y)f(x, 7)Y3,(XP 7)F(3, )13(

x)-(y-8x-yx-6x  p)-(1 px-y

8  p)-(1 p

x

6 y)f(x, ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ =

 

onde f(x, y) é a função de probabilidade conjunm si.

Exemplo 8: Como uma continuação do exemplo 7, considere f(x | y) como a funçãode probabilidade condicional de X dado Y.

F(3 | 7) = P(X = 3 | Y = 7) = 0.408 da equação (4)

f(y)y)f(x, = 

y)

y)Yx,P(X y)Y|xP(X y)|f(x )15(

======

P(Y =

 

Page 33: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 33/141

 

Para encontrar a fórmula geral para f(x | y) (isto é, para qualquer valor de x e y),rimeiro deixe f(x, y) ser a função de probabilidade conjunta de X e Y. Isto é dado noxemplo 7 como

que originalmente era uma forma geral da equação (2). Também, deixe f(y) ser a função de probabilidade de Y. Do exemplo 4, novamente, podemos generalizar da seguinte maneira

Pela definição 9 podemos agora escrever a função de probabilidade condicional de X dado Yy

ente

 Definição 10:

 pe 

x)-(y-8x-yx-6x

 p)-(1 px-y

 p)-(1 px

6

 y)f(x, ⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

=

y-14y  p)-(1 py

14 y)P(Y f(y) ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ===

=

 

onde todos os termos que envolvem o parâmecancelados.

tro desconhecido p foram convenientem

Considere X1, X2, ... , Xn como variáveis aleatórias com as respectivasfunções de probabilidade f 1 (x1), f 2 (x2), ... , f n (xn) e com a função de probabilidade conjunta f (x1, x2, ... , xn ). Então X1, X2, ... , Xn são mutuamente independentes

(17) se: f(x1, x2, ... , xn ) = f 1 (x1) f 2 (x2) ... f n (xn)

 para todas as combinações dos valores de x1, x2, ... , xn.

Exemplo 9: Considere o experimento descrito no exemplo 8. Então, a função de probabilidade de X é dada por 

e a função de probabilidade de Y é dada por 

∫  ≤≤

≤≤

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ 

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

==8x-y0

6x0  para 

y

14

x-y

x

6

 f(y)

y)f(x, y)f(x)16(

y-14y2  p)-(1 p

y

14 y)(YP (y)f  (19) ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ===

x-6x1 ) p-(1 p

x

6 x)(XP (x)f  (18) ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ===

Desde que:

Page 34: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 34/141

 

f(x, y) = P(X = x, Y = y) = y)

vemo 

e, por esta razão, X e Y não são independentes.

P(X = x | Y = y) P(y =

O uso das equações (16) e (19) resulta na função de probabilidade conjunta de X e Y,sendo dada por 

desde que:

s que:

f(x, y) é diferente de f 1(x) f 2(y)

y-14y  p)-(1 px-y

x

6  ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ =

 ⎠⎝ 

yx-20yx21  p)-(1 p

y

14 

x

6 (y)f  (x)f  ++

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ =

y-14y  p)-(1 py

14 

y

14

x-y

x

6

 y)f(x, ⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ 

⎟⎟ ⎞

⎜⎜⎛ 

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

=

 

Page 35: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 35/141

 

CAPÍTULO 5DISTRIBUIÇÃO NORMAL

Uma função de distribuição mostra, para uma população, a freqüência relativa(números reais) de uma variável aleatória

urais que sãocon r) ou distribuição com a formade s

(probabilidade) com que diferentes valores

ocorrem. Em geral, cada população tende a ter a sua própria distribuição. No entanto, adistribuição normal é a mais popular de todas por causa de sua grande aplicabilidade naaproximação do comportamento de um grande número de variáveis aleatórias nat

tínuas. Ela é conhecida como distribuição de Gauss (difusoino – V. Figura 5.1. abaixo.

Função: 

( )( )( )

σ 

µ 

π σ σ µ 

2

5.0

2

1,;

−−

= x

e xn  

Para: +∞<<∞−  x  

 µ 

σ 

-3 -2 -1 1 2 3z

68,27%

95,45%99,73%

- ∞ + ∞

 Figura 5.1: Curva normal pad

 

rão

Propriedades:

  A curva normal padrão (CNP) tem µ = 0 e σ = 1

  A CNP é simétrica em torno de zero

ibuição normal. Se você usar os testes desenvolvidos com base na distribuição normal,sem atender a condicionante da normalidade, o teste perde a robustez e a consistência e os

  Área sob a CNP é igual a 1  A CNP se estende indefinidamente em ambas direções

  A maior parte (99,73%) da CNP fica entre -3 σ e +3 σ 

Toda a estatística paramétrica foi desenvolvida com base nos pressupostos dadistr 

 

Page 36: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 36/141

 

seus re o

da normalidade.

ativa da médiaverdadeira da população, µ. Por exemplo, podemos estar interessados em saber:

ter a idade m a tarefa muito fácil. Não há necessidade de fazer r por 18. Entretanto, em nossa área de

“muito grandes” com tendência aoinfinito

sultad s podem perder toda a confiabilidade. Entretanto, nem sempre as variáveisaleatórias distribuem-se na forma perfeita de um sino (µ = 0 e σ = 1). Há várias maneirasde superar este tipo de obstáculo, como aumentar o número de amostras e fazer transformações. Só não pode ignorar o detalhe

5.1. Estimando a média da população:  Na estatística de inferência tudo gira em torno da obtenção da estim

  o volume médio, µ, de uma determinada área florestal

  a idade média, µ, dos estudantes da turma-2006 do CFT

Se a população é pequena, µ é calculada sem problemas; no caso de populaçõesmaiores, a média tem que ser estimada usando amostragem de parte da população. No caso doCFT, 18 estudantes, ob édia é umamostragem, basta somar a idade de cada um e dividiconhecimento, a gente só trabalha com populações

. Neste caso, fica muito difícil e caro, senão impossível, obter a média verdadeira da população, µ. Levando em conta os princípios e as condicionantes da amostragem, é possívelobter informação suficientemente precisa (e confiável) sobre µ tomando apenas parte da

 população para estimar a média amostral  x _ 

Exemplo 1: queremos saber a idade média dos estudantes da pós-graduação do INPA,que tem uma população igual a 200. Para isso, selecionamos, aleatoriamente, 10 estudantes eanotamos a idade de cada um. Portanto, temos uma amostragem de 10 estudantes de uma

 população de 200 - hipoteticamente.

Quadro 5.1. idades de 10 estudantes de pós-graduação do INPA

estudante 1 2 3 4 5 6 7 8 9 10

idade 23 25 26 28 26 24 25 27 30 26

A idade média (amostral) será:

 x _ 

= ( ∑ xi ) / n 

 para: n = 10 e i = 1, 2, ... n 

 x _ 

= 26 anos

Se você utilizou uma amostra representativa da população, você estará afirmando quea média s, µ

 

, deve ser em torno de 26 anos.verdadeira da população dos 200 estudante

Diante disso, surgem algumas questões:

(i)  Qual é a justificativa para utilizar a média amostral  x _ 

 para estimar a média da população µ ?

(ii)  Qual é a confiança sobre a precisão envolvida ao usar  x _ 

 para estimar µ ? Noexempl , ual é a probabilidade da idadeo 1 se uma amostragem com 10 estudantes é utilizada, q

 

Page 37: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 37/141

 

 x _ 

média a ostral,m , estar dentro de um intervalo (vamos dizer, 1 ano) da média da população,µ ?

) amostragem para assegurar uma certa precisã o

(iii   Qual é a necessária intensidade deo c m grande confiança? No exemplo 1, quão grande deveria ser uma amostragem

(10? 20 estudantes?) para assegurar que 95% de todos os possíveis  x _ 

caíssem dentro de uminterva

er todas estas questões nesta apostila. A primeira será respondida, parcialm

lo de 1 ano da média da população, µ ?

Vamos respondente, neste capítulo e completada no capítulo 6. As outras duas (ii e iii) serão

respondidas nos capítulos 6 e 7, respectivamente.

Ao amostrar uma população, a média amostral,  x _ 

, é uma variável aleatória. Nocapítulo média da população.A ince ce sobre qual a amostra foi selecionada.Apesar disso, a incerteza dim

sentenç

6, vamos ver, em detalhes, como este valor é “parecido” com arteza da estimativa depende de uma chan a

inui com o aumento da intensidade de amostragem. Isto é uma

a de um teorema matemático chamado “a lei dos grandes números” e é a nossa justificativa para usar  x

 _ 

 para estimar µ.

5.2. Curva normal padrão (CNP) ou curva-z:

A “lei dos grandes números” é a nossa justificativa matemática para usar   x _ 

 parasma forma, ela não é particularmente útil paraisão de tais estimativas. Esta lei, por exemplo,

estimar µ ...justifica, mas não explica. Da meresponder questões práticas envolvendo a prec

não informa sobre a probabilidade de  x _ 

estar dentro do intervalo de 1 ano de µ. As

 probabilidades para  x

 _ 

 podem ser obtidas “aproximadamente” usando áreas sob certas curvasforma de “sino”.

H

em

á várias curvas normais, que variam de acordo com a média e desvio padrão, µ e σ.

a, usar a CNP para obtenção

em todas as probabilidades (áreas sob a CNP) calculadas com precisão de dois

 No entanto, a curva que norteia todas as outras curvas, é a curva normal padrão (Figura 5.1).Tanto a forma como as propriedades da CNP podem ser vistas nesta figura. Só existe umaúnica curva normal padrão, com µ = 0 e σ = 1. Quando você tem pela frente situações commédias e desvios diferentes de 0 e 1, respectivamente ... não entre em pânico! Tudo que temque ser feito é “padronizar” a sua variável aleatória e, em seguiddas probabilidades (ou áreas).

A curva apresentada na Figura 5.1. foi desenhada depois de integrar a função de

distribuição, de z = 0 a z = 3,9 para a primeira metade da curva à direita de 0. Como a parte dacurva à esquerda de 0 é espelho da parte à direita, as probabilidades da esquerda foramcalculadas de z = -3,9 a z = 0. Portanto, o trabalho braçal já está feito. A Tabela 1 (anexo daapostila) tdígitos.

Vamos ver como funciona a Tabela 1 (anexo da apostila) usando alguns exemplos. Asfiguras que ilustram o uso da Tabela 1 estão no anexo deste capítulo.

Exemplo 2: Achar a área sob a curva normal padrão (CNP) à esquerda de z = -0,97.

  A solução gráfica está na Figura 5.2-a.

  Você vai direto à tabela 1 e procure z = -0,9 (sentido vertical), depois o centésimo(7) (sentido horizontal) e no encontro dos dois números (0,97), você tem a área (que é a probabilidade) sob a CNP.

Page 38: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 38/141

 

    Neste caso, a área é igual a 0,1660. Isto quer dizer que 16,6% da área está àesquerd

P é igual a 1.

a de z = -0,97 ou que 83,4% está à direita de z = -0,97.

   Não esquecer que a área total sob a CN

 

Exemplo 3: Achar a área sob a CNP à direita de z = 2,5.  Veja a solução gráfica na Figura 5.2-b.

  De novo, você vai à tabela 1 e procure z = 2,5, depois o centésimo 0 e no encontrodos dois números (2,50), você tem a área (que é a probabilidade) sob a CNP.

   Neste caso, você está calculando a área sob a CNP de - ∞ até 2,5, que dá 0,9938 ...à esque

ubtrair de 1 (áreatotal da á 1 –  0,9938 eita da CNP.

rda de z = 2,5.

  Como você quer saber a área à direita de z = 2,5, você tem que sCNP) e aí sim você terá a área à direita de z = 2,5. Assim, a área à direita ser 

= 0,0062, ou seja, 0,62% da área está à dir 

Exemplo 4: Achar a área sob a CNP entre z = -1,04 e z = 2,06.

 Veja a solução gráfica na Figura 5.2-c.

  Neste caso, são necessários os seguintes passos: (1) achar a área à esquerda de z =-1,04, que é igual a 0,1492; (2) achar a área à direita de z = 2,06, que é igual a 0,9803; (3)calcular a área entre z = -1,04 e z = 2,06, que é dada pela diferença (0,9803 – 0,1492), que éigual a 0,8311.

5.3. Á ntrar as áreas sob a curva normal padrão

(CNP). riações da média µ edo desvio padrão ostral

 Portanto, a resposta é: a área sob a CNP entre z = -1,04 e z = 2,06 é 0,8311, ou seja,83,11% da área da CNP está entre os dois pontos de “z”.

reas sob outras curvas normais:  Na seção anterior mostramos como encoNo entanto, há várias curvas normais, que variam de acordo as va

σ. Para calcular as probabilidades (áreas sob a CNP) para a média am

 x _ 

(o princip

são usualmente representados por média µ e desvio padrão σ. O parâmetro µ nos diz

No entanto, no mundo real esta condição de µ = 0 e σ = 1 é praticamente impossívelIgual à CNP, a

ouassimétrica. A assimétrica pode ser negativa (maior freqüência dos dados tendendo à direita

al objetivo), precisamos ser capazes de encontrar as áreas sob qualquer curvanormal.

Cada curva normal pode ser identificada por 2 números chamados parâmetros. Estesdois parâmetros

onde a curva está centrada e σ indica a dispersão da curva normal. Como vimos na

Figura 5.1, quando µ = 0 e σ = 1, temos a curva normal padrão.

de ser verificada. Os parâmetros µ e σ variam entre populações diferentes.curva normal (ou curvas normais) é centrada na µ  e quanto maior for  σ, mais dispersa(achatada ou esparramada) será a curva. A curva normal tem as mesmas propriedades daCNP. A única diferença é que o eixo horizontal da CNP é z e das outras curvas normais, oeixo é x.

As curvas normais podem assumir diferentes formas. As figuras 5.3-a, 5.3-b e 5.3-cilustram as diferentes formas, as quais podem ser consideradas, respectivamente, como

 platicúrtica, mesocúrtica e leptocúrtica. É óbvio que existe um limite de achatamento para quea curva seja considerada normal. Este limite pode ser determinado usando o teste deachatamento ou curtose. Da mesma maneira, a curva normal pode ser simétrica

Page 39: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 39/141

 

do eixo horizontal) e positiva (maior freqüência tendendo à esquerda do eixo) – V. Figura 5.4.Também neste caso, há limite para a assimetria, que pode ser definido usando o teste deassimetria.

Exemplo 5: Achar área sob a rv rm = σ )  x = 1 e x = -1.

ção gráfica na r -a

: z = 3,0 (para x = 1) e z = 1 (para x = -1).

tanto, a resposta é: a área sob a curva normal entre x = -1,0 e x = 1,0 é 0,1574,

cu a no al (µ -2 e = 1 entre

 Veja a solu Figu a 5.5 .

 Primeiro de tudo é preciso padronizar a variável aleatória “x”.

 Os resultados da padronização são

 Agora, você vai a Tabela 1 (anexo da apostila) para: (1) achar a área à direita de z =3,0, que é igual a 0,9987; (2) achar a área à direita de z = 1, que é igual a 0,8413; (3) calcular a área entre z = 3,0 e z = 1,0, que é dada pela diferença (0,9987 – 0,8413), que é igual a0,1574.

 Por ou seja, 15,74% da área sob a curva normal está entre os dois pontos de “x”.

Exemplo 6: Achar a área sob a curva normal (µ = 3 e σ = 2) entre x = 2 e x = 7.

 Veja a solução gráfica na Figura 5.5-b.

 Primeiro de tudo é preciso padronizar a variável aleatória “x”.

2,0 e x = 7,0 é 0,6687, ou

 Os resultados da padronização são: z = -0,5 (para x = 2) e z = 2,0 (para x = 7).

 Agora, você vai a Tabela 1 (anexo da apostila) para: (1) achar a área à esquerda de z= - 0,5, que é igual a 0,3085; (2) achar a área à direita de z = 2, que é igual a 0,9772; (3)

calcular a área entre z = -0,5 e z = 2,0, que é dada pela diferença (0,9772 – 0,3085), que éigual a 0,6687.

 Portanto, a resposta é: a área sob a curva normal entre x =seja, 66,87 % da área sob a curva normal está entre os dois pontos de “x”.

Exemplo 7: Achar área sob a curva normal (µ = 6 e σ = 3) entre x = 0 e x = 12.

 Veja a solução gráfica na Figura 5.5-c.

 Primeiro de tudo é preciso padronizar a variável aleatória “x”.

 Os resultados da padronização são: z = -2,0 (para x = 0) e z = 2 (para x = 12).

 Agora, você vai à Tabela 1 (anexo da apostila) para: (1) achar a área à direita de z =2,0, que é igual a 0,9772; (2) achar a área à esquerda de z = -2, que é igual a 0,0228; (3)calcular a área entre z = 2,0 e z = -2,0, que é dada pela diferença (0,9772 – 0,0228), que é

ual aig 0,9544.

 Portanto, a resposta é: a área sob a curva normal entre x = 0 e x = 12 é 0,9544, ouseja, 95,44 % da área sob a curva normal está entre os dois pontos de “x”.

5.4. Populações normalmente distribuídas e variáveis aleatórias:

Agora chegou a vez de ver como se usa as áreas sob as curvas normais para encontrar 

as probabilidades para  x

 _ 

(aproximadamente). Antes, porém, vamos fazer algumasconsiderações sobre populações e variáveis aleatórias normalmente distribuídas.

Page 40: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 40/141

 

A grande maioria (não todas) das populações e variáveis aleatórias que sãorepresentadas por quantidades como peso, volume, área basal, DAP etc. tem distribuição de

 probabilidade que pode ser representada, pelo menos aproximadamente, por meio de curvasnormais. Em outras palavras, as probabilidades para tais quantidades podem ser encontradas

s normais. Vamos ver isso com exemplos. por meio da interpretação das áreas sob as curva

  Exemplo 8: Uma população consistindo do peso (em kg) de um grupo de 100estudantes de mestrado. Os dados da população estão sumarizados no quadro abaixo.

Quadro 5.2: distribuição de pesos de uma população em intervalos de 1 kg.

Peso (x) 69 70 71 72 73 74 75 76 77 78 79

freqüência (f) 1 2 6 13 17 20 18 12 7 3 1

f relativa (prob) ,01 ,02 ,06 ,13 ,17 ,20 ,18 ,12 ,07 ,03 ,01

O histograma e o polígono de freqüências (absoluta e relativa) dos dados contidos no.

Como em qualquer população, podemos associar a esta população de pesos, uma

 plesmente as freqüências relativas. Exemplo: qual é probabilidadede pegar um estudante com peso ig % ou 0,13 (freqüência relativa doquadro 5.2).

rmos das

s parâmetros µ  e σ, onde µ  é a média da

Do quadro 5.2, a média (µ  padrão (σ) é igual a 1,95. Estes dois parâmtrabalhar com uma curva normal 1,95. Podemos querer saber, por 

.2, temos a probabilidade exata disto acontecer, olhando apenas para a freqüência

iferente. Nem sempre você tem uma população tão

r  µ  e σ e as freqüências relativas. Vamos

quadro 5.2 são apresentados na Figura 5.6

variável aleatória x, como o peso de um estudante selecionado ao acaso. Neste caso, as probabilidades de x são sim

ual a 72 kg? Resposta: 13

O ponto importante deste exemplo é que o histograma de freqüência (Figura 5.6) temuma quase perfeita forma de sino. Por causa disto, seremos capazes de aproxima

 probabilidades para x usando as áreas sob uma curva normal. Como você pode notar, a curva

normal apropriada é simplesmente aquela com o população (ou da variável aleatória x) e σ é o seu desvio padrão.

) da variável aleatória x é igual a 70,06 kg e o seu desvioetros podem ser sobrepostos à Figura 5.6 para

com µ = 74,06 e σ =exemplo, qual é a probabilidade (área) de pegar, aleatoriamente, um estudante com 72 kg. Doquadro 5relativa desta classe (72), que é 0,13 ou 13%. A propósito, a classe 72 vai de 71,5 a 72,5.Desta forma, podemos escrever assim: P (71,5 < x < 72,5) = 0,13.

  No entanto, o mundo real é d

  pequena e tão bem organizada que permite tetrabalhar, agora, sem as freqüências relativas. Você tem uma população com µ = 74,06 e σ =1,95 e quer saber qual é a probabilidade (área) de pegar, aleatoriamente, um estudante com 72kg.

Passos necessários: (1) desenhar a curva normal com µ = 74,06 e σ = 1,95; (2) definir o quê você está procurando, que é a probabilidade P (71,5 < x < 72,5); (3) padronizar asvariáveis aleatórias, x = 71,5 e x = 72,5; (4) achar as áreas para os respectivos “z” sob a CNP

exo da apostila).

Solução

(Tabela 1 do an

: a padronização das variáveis aleatórias x = 71,5 e x = 72,5 resulta em z = -1,31 e vai à Tabela 1 para encontrar as áreas sob aCNP para z = -1,31 e z = -0,80, obtendo as áreas 0,0951 e 0,2119, respectivamente. O

0,0951 = 0,1168, ou seja, a probabilidade de selecionar,com peso igual a 72 kg (71,5 a 72,5) é de 11,68%.

z = -0,80, respectivamente. Agora, você

resultado é então: 0,2119 -aleatoriamente, um estudante

Page 41: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 41/141

 

Sumarizando: a probabilidade exata de selecionar, aleatoriamente, um estudante com pesoigual a 72 kg é de 13% e a estimada é de 11,68%.

Um importante ponto do exemplo 8 é que, para certas populações e certas variáveis

são aproximadamente

 .5. P variável aleatória:

va normal com parâmetros diferentes deµ = 0 e onverter os valores de x para valores dez por m  

aleatórias, podemos usar as áreas sob a curva normal para determinar as probabilidades. Nestecaso, podemos dizer que a população ou a variável aleatória é normalmente distribuída. Dizer que uma população ou variável aleatória é normalmente distribuída (aproximadamente)significa que as probabilidades para a população ou variável aleatóriaiguais às áreas sob a curva normal.

5 adronizando a

Já vimos que para encontrar as áreas sob a cur  σ = 1 é preciso usar a padronização, ou seja, ceio da seguinte fórmula: 

σ 

−=

 x z

 

antes mos ver o significado de z e seusdesdob

  xemplo 9

de usar a curva normal padrão (CNP). Varamentos com exemplos.

E : Considere o DAP de uma árvore selecionada ao acaso. Então, DAP é umavariáve édia µ = 100 cm e desvio padrão σ = 10. Por meio da padronizaçãoda variável

l aleatória x com mosx terem

  x 100−

= z10

 

ente, uma árvore qualquer da ZF-2, com 120 cm de DAP, por exemplo, o que acontece?

e a árvore selecionada,a população.

O processo pode ser também invertido, ou seja, temos o z e queremos encontrar ovalor da variável aleatória x. Vamos ao exemplo.

Exemplo 10

e se pegarmos, aleatoriam

z = (120 – 100) / 10 = 2

Qual é o significado deste número, z = 2? Isto significa qualeatoriamente, com DAP = 120 cm está a dois desvios (σ) da média d

: temos z = 1,5; isto é, a variável x está 1,5 vez σ da média. Qual é x?

1,5 = (x – 100) / 10 = ?

x = 100 + 10(1,5) = 115

ou seja, nesta população, uma árvore para estar 1,5 vez do desvio, tem que ter DAP igual a115 cm.

Agora, vamos ao principal ponto desta seção. Considere x uma variável aleatórianormalmente distribuída com média µ e desvio padrão σ. Então, a variável aleatória, que podeser padronizada da seguinte maneira:

σ 

−=

 x z  

Page 42: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 42/141

 

tem a distribuição normal padronizada. Desta maneira, nós calculamos as probabilidades paraa variável x por meio da interpretação das áreas sob a CNP. Daqui para frente, este fato seráusado como guia.

Exemplo 11: pense na floresta adulta (DAP ≥ 25 cm) do Distrito Agropecuário daSuframa, onde todos os DAPs são normalmente distribuídos com µ = 35 cm e σ = 5.

Sabemos que a var 

 

iável x  padronizada

5

35−=

−=

 x x z

σ 

µ  

tem a distribuição normal pa m as propriedades da CNPmos

drão. Isto quer dizer que, de acordo cote

( )( ) 9545,022 =<<−

( ) 6827,011

9973,03

=<<−

3 =<<−

 zP

 zP

Considerando que z é simplesmente o número de desvios padrões que x se afasta desua média, podemos dizer que as probabilidades para intervalos contendo ± 1 desvio, ± 2desvios e ± 3 desvios são, respectivamente, 0,6827, 0,9545 e 0,9973.

 No caso da floresta do Distrito, isto quer dizer, com base nos parâmetros de média µ =35 cm e desvio σ = 5, temos o seguinte:

(i) P (-1 < z < 1)35 – 1 (5) = 30

35 + 1 (5) = 40 => limite superior do intervalo

(ii) P (-2 < z < 2)

35 – 2 (5) = 25 => limite inferior do intervalo

35 + 2 (5) = 45 => limite superior do intervalo

(iii) P (-3 < z < 3)

35 – 3 (5) = 20 => limite inferior do intervalo

35 + 3 (5) = 50 => l

 

Sumarizando:

a) 68,26% das árvores do Distrito têm DAPs entre 30 e 40 cm

 b) 95,44% das árvores do Distrito têm DAPs entre 25 e 45 cm

c) 99,74% das árvores do Distrito têm DAPs entre 20 e 50 cm

 zP  

=> limite inferior do intervalo

imite superior do intervalo

Page 43: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 43/141

 

-3 -2 -1 1 2 30

σ 

 µ= 0 

Z = -0,97 

 Área = 0,1660 

 

Figura 5.2-a: área à esquerda de z = -0,97

-3 -2 -1 1 2 30

σ 

 µ= 0 

Z = 2,5 

 Área = 0,9938 

 

Figura 5.2-b: área à direita de z = 2,5

Passo 1: área para z = -1,04 Passo 2: área para z = 2,06

-3 -2 -1 1 2 30

σ 

 µ= 0 

Z = -1,04

 Área = 0,1492 

-3 -2 -1 1 2 30

σ 

 µ = 0 

Z = 2,06 

 Área = 0,9803

 

Final: Área entre z = - 1,04 e z = 2,06

-3 -2 -1 1 2 30

σ 

 µ = 0 

Z = 2,06 Z = -1,04

Área = 0,9803 – 0,1492 = 0,8311  

Figura 5.2-c: entre z = - 1,04 e z = 2,06

Page 44: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 44/141

 

 

µ = -2σ = 1

Figura 5.3-a: curva normal com

µ = 3σ = 2

Figura 5.3-b: curva normal com

µ = 6σ = 3

Figura 5.3-c: curva normal

630-3 9 12 15

 

-2-3-4-5 -1 0 1

 x 

31-1-3 5 7 9

 x 

 

Page 45: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 45/141

 

 

POSITIVA NEGATIVA

ASSIMETRIA

 

Figura 5 ormais.4: Assimetria das curvas n

 

Page 46: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 46/141

 

 

-2-3-4-5 -1 0 1

0-2-3 1 2 3-1

Padronizando “x”x - µ

z = ------------

σ

1 – (-2)z = ------------ = 3,0

1

-1 - (-2)

z = ------------ = 1,01

 x 

Área sob a curva normal (µ = -2 e σ = 1) entre x = 1 e x = -1)

z = 3z = 1  

Figura 5.5-a: Exemplo 5

31-1-3 5 7 9

0-1-2-3 1 2 3

 x 

Padronizando “x”x - µ

z = ------------σ

Área sob a curva normal (µ = 3 e σ = 2) entre x = 2 e x = 7)

2 – (3)z = ------------ = -0,5

2

7 - (3)z = ------------ = 2,0

2

z = 2 z = - 0,5   

Figura 5.5-b: Exemplo 6

630-3 9 12 15

0-1-2-3 1 2 3

 x 

Padronizando “x”x - µ

z = ------------σ

Área sob a curva normal (µ = 6 e σ = 3) entre x = 0 e x = 12)

0 – (6)z = ------------ = -2,0

3

12 - (6)z = ------------ = 2,0

3

z = -2,0 z = 2,0    

Figura 5.5-c: Exemplo 7

Page 47: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 47/141

 

 

0

25

5

10

15

20

   f  r  e  q  a   b  s  o   l  u   t  a

0,05

0,1

0,15

0,2

   f  r  e  q  r  e   l  a   t   i  v  a   (  p  r  o   b   )

69 70 71 72 73 74 75 76 77 78 79

peso (kg)

0

0,25

 

Figura 5.6: Histograma e polígono de freqüência (absoluta e relativa).

Page 48: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 48/141

 

 x _ 

Capítulo 6 – Distribuição amostral da média ( )

anejo,

Por analogia, média (volume) de uma floresta é o mesmo que a “média” usada paradefinir café-com-leite em muitos bares do sul e sudeste do Brasil. Em um copo de 100 ml,uma média deveria ter 50 ml de café e 50 de leite. Certo? Errado ... porque se fosse assim, o

 balconista não teria na ponta da língua aquela pergunta: “mais café ou mais leite?” Mais leiteou mais café vai depender do gosto do freguês e da mão do balconista. Você tem que confiar 

 por causa dos custos de coletas de

em é o número total de amostras ( n ) dividido pelo número

500 m2 cada (¼ hectare) para realizar o inventário florestal; nesteaso n = 100 e N = 4.000 (nº total de possíveis amostras de, ¼ ha, ou seja, 20x125m).

Do ponto de vista teórico, vamos mostrar como calcular as probabilidades de  

Todo eng florestal sabe que o inventário florestal é o primeiro passo para planejar om sentido lato de uma floresta, nativa ou artificial. O inventário, por sua vez, consisteem obter uma média representativa da população de interesse seja em termos de volume, área

 basal ou outra variável de interesse.O que é uma média representativa?

ou parar de tomar aquela “média” naquele bar. De qualquer modo, o total do copo não passaráde 100 ml, ou seja, o excedente de café (+) será anulado pelo que falta de leite (-) ou vice-versa.

Vamos mostrar neste capítulo que a estimativa de uma média tende sempre a ser  parecida com a média verdadeira da população. O que muda é o desvio padrão, que é base decálculo da incerteza. A tendência é diminuir a incerteza (que é bom) com o aumento daintensidade de amostragem. Portanto, média representativa é aquela que proporcionaconfiança (incerteza sob controle) e conforto ($) para quem vai usá-la.

6.1. Amostras aleatórias

Amostra pode ser um único indivíduo ou um conjunto deles. No caso de pesquisas deopinião, cada eleitor é uma amostra. No caso de inventário florestal, um conjunto de árvorescorresponde a uma amostra. Na Amazônia, vários estudos apontam que parcela de 2.500 m2 ésuficiente para cobrir as variações (volume) de uma determinada área florestal com DAP ≥ 20cm, ou seja, um conjunto com aproximadamente 50 árvores.

Em geral, as amostras têm que ser tomadas de forma aleatória, pois foi assim que aestatística de inferência foi concebida. No entanto, a amostragem aleatória pode ser desdobrada em: inteiramente aleatória e aleatória restrita. Tanto nos inventários, como em

 pesquisas de opinião, a aleatória restrita é a mais utilizadadados e tem produzido bons resultados. No caso de eleições presidenciais, a população deeleitores brasileiros é estratificada por sexo, idade e, principalmente, por densidade eleitoral.Em inventários na Amazônia, a maioria utiliza a amostragem em dois estágios, ou seja,seleciona aleatoriamente a unidade primária e distribui as unidades secundárias de forma

sistemática.Intensidade de amostrag

total de possíveis amostras em uma população ( N ). Por exemplo: os institutos de pesquisas(Ibope, Datafolha etc.) ao realizar uma pesquisa de opinião sobre eleições presidenciais noBrasil, têm utilizado em torno de 4.000 eleitores de um total de 115 milhões; neste caso, n =4.000 e N = 115 milhões. No nosso caso, se você tem uma área de 1.000 hectares e quer instalar 100 amostras de 2.c

 x _ 

 

usando as áreas sob as curvas normais. Isso quer dizer que temos que determinar adistribuição da probabilidade da variável aleatória  x

 _ 

. A distribuição de probabilidade de  x _ 

échamada de distribuição amostral da média.

Page 49: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 49/141

 

6.2. A média da média (  x _ 

 ) e o desvio padrão de ӯ ( σ x _ 

)

O primeiro passo para descrever a distribuição amostral da média é saber como

encontrar a média e o desvio padrão da variável aleatória  x _ 

. Isto é necessário para usar os

métodos da curva normal para encontrar as probabilidades para  x _  .

As fórmulas para calcular essas duas variáveis são:

⎟ ⎠ ⎞

⎜⎝ ⎛ ×⎟

 ⎠ ⎞

⎜⎝ ⎛ = −− ∑

i xi

 x

 p xµ   

e

( )⎟

 ⎞⎜⎛ ×

−= ∑ i xi

 p x

2µ 

σ 

 ⎠⎝ −

−−

=

ostragem. No entanto, se você entender o significado da estimativa da médiaerro padrão da média conforme se aumenta intensidade

ariáve

2 e 3. A situação 1 se refere a uma amostragem considerando n = 2, ou seja,

i x

i

 x n1

1  

Vamos ver isso por meio de um exemplo meio irreal. Vamos considerar as idades(congelada em 2003) de cada membro de minha família (eu, mulher e 3 filhos) como uma

 população, ou seja, N = 5. Esta situação nunca será encontrada na vida real porque para saber a idade média dessa família basta somar as 5 idades e dividir por 5 ... ninguém vai utilizar osrecursos da amda população e o comportamento do

ostragemde am , para uma pequena população (N = 5), fica mais fácil entender essas duasv is aleatórias quando for trabalhar com uma população grande ou infinita (número deeleitores do Brasil, N = 115 milhões, floresta da ZF-2 etc.).

Temos 3 situações ilustrando a utilização de 3 intensidades diferentes de amostragem – anexos 1,escolha aleatória de 2 pessoas para estimar a média da população. Primeiro você tem quesaber quantas combinações são possíveis ao sortear 2 (n) de um conjunto de 5 (N) pessoas. Só

 para lembrar: fatorial de zero (0!) é igual a 1 e fatorial de números negativos ou não inteirosnão existe. Isto é mostrado na página que ilustra a situação 1. Depois disso, você tem que

estimar a média de cada combinação possível. Aplicando a fórmula de µ x _ 

 você vai encontrar a média da média de todas as possíveis combinações. Você vai notar que a média da média éexatamente igual à média verdadeira da população.

Repetindo as mesmas operações para as situações 2 e 3, respectivamente, amostragens

de n = 3 e n = 4, você vai notar que a média da média será sempre igual à média da população, mudando apenas o desvio padrão da média. Resumindo: a média da amostra seráse muito parecida com a da população e conforme você aumenta o n, o desvio padrão damédia (ou erro ou incerteza) d inui. Você se convenceu desta afirmativa? Se não, é melhor tentar a vida em outra praia.

Se sim, vamos pensar agora em termos de população de verdade. Vamos falar deeleitores brasileiros. Em geral, os institutos utilizam aproximadamente 4.000 eleitores parain erir 

mpreim

f sobre a população de 115 milhões de eleitores brasileiros. Quantas possíveismbinco ações são possíveis quando a gente utiliza n = 4000 de N = 115 milhões? É só fazer as

contas ... mas não as faça.

Page 50: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 50/141

 

115.000.000 115.000.000 != ------------------------------------- possíveis combinações

4.000 4.000 ! (115.000.000-4.000) !

115.000.000 115.000.000 != ------------------------------------- possíveis combinações

4.000 4.000 ! (115.000.000-4.000) !  

É óbvio que ninguém vai fazer todas as possíveis combinações. Se fizesse, a média damédia seria exatamente igual à média da população. Então, o que é feito? As empresas tomamapenas uma única combinação de 4000 eleitores para in

 

ferir sobre a população de eleitores  pressupondo que a média estimada na pesquisa será igual à da população e que n = 4000 produzirá uma incerteza (erro) menor que n = 3.999.

Em uma floresta de porte médio como a da ZF-2, por exemplo, com 21.000 hectares,temos N = 84.000 (21000 x 4) amostras possíveis de ¼ ha cada. Se a gente usar n = 50,quantas possíveis combinações seriam possíveis? Várias. Quantas combinações a gente fariano caso de um inventário florestal? Certamente, apenas uma. A nossa expectativa é ter umamédia (volume ou outra variável) representativa da população com uma margem de erroaceitável.

A média é importante porque sem ela não há planejamento. No entanto, maisimportante mesmo é saber com que margem de erro (incerteza) a gente está trabalhando. Éimportante também não perder de vista que a intensidade de amostragem está diretamenterelacionada com os custos. No caso de inventários, você tem duas alternativas: (1) fixa aincerteza e libera os custos ou (2) fixa os custos e libera a incerteza. Em geral, a segundaalternativa é a mais freqüente. Há meios para se prevenir de incertezas indesejadas.

Em inventários florestais, você pode se prevenir utilizando boas imagens, bons mapas, bons equipamentos e métodos adequados de amostragem, em combinação com planejamentode coleta e processamento dos dados. Estamos falando de erros de amostragem (o erro quevocê comete por medir apenas parte da população). Não confundir com erros não-amostrais(humanos, principalmente), que não são tratados aqui. Não esquecer também que n édenominador.

6.3. Teorema do limite central 

Vimos até aqui que a confiança na média passa pela confiança nas probabilidades quea gente trabalha. No próximo capítulo vamos ver como calcula a incerteza de uma estimativa.Aqui, vamos nos concentrar nas probabilidades obtidas usando as áreas sob as curvasnormais.

Temos a curva normal padrão com µ = 0 e σ = 1. Com a integração da função quedescreve esta curva, a gente obtém as probabilidades. Estas áreas já foram calculadas por vários autores e estão disponíveis em apêndices de livros de estatística, tabela-z. No mundoreal, a curva normal com estas características não existe. Por esta razão, a gente tem que

 padronizar as possíveis curvas normais para utilizar a tabela-z. As curvas normais podem ser,dentro de limites bem definidos, assimétricas ou achatadas, diferentes da forma de sino. Paraisso, há testes para saber se as suas variáveis de interesse estão dentro desses limites.

Difícil mesmo é fazer a nossa variável ficar dentro dos limites da distribuição normal. Não entre em pânico ainda! O remédio para essa situação é o “teorema do limite central”. Oque diz este teorema?

“Quando uma amostragem aleatória de tamanho n (onde n é pelo menos igual a 30) é

tomada de uma população, a  x _ 

 é aproximadamente normalmente distribuída com µ x _ 

= µ e

desvio padrão da média σ x _ 

= σ/ n . Nestas condições, as probabilidades para  x _ 

podem ser 

Page 51: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 51/141

 

encontradas, aproximadamente, utilizando as áreas sob a curva normal com os parâmetros µ e

σ x _ 

.”

Isto q ua variávelaleatória assumir, você pode tabela-z, desde que n ≥ 30.

Significa também que para as amostras aleat ias de qualquer distribuição com média µ  edesvio padrão σ

uer dizer que: independentemente da forma que a distribuição de scalcular as probabilidades usando a

ór 

 x _ 

, a média amostral dessas unidades de tamanho n é aproximadamentenormal e esta aproximação melhora conforme aumenta o n. Para se chegar a este “númeromágico” igual a 30, foram feitas inúmeras sim lações até constatar que acima deste número

 b a curva normal e de outras funções.

Tanto em t abalhos u ários orestais, o ide u maa agem m, enos 0 unid s amo is. S ê f ass inc que

con , é nsistente; caso contrário, você terá que compro no dad s de p sit uma amostragem com n < 30 é considerada “pequena” e a curva- que

t se iza a para a obt ção da babi es.

seu

não se percebe diferenças entre as áreas so

r de pesq isas ou de invent fl al é tilizar umostr co pelo m , 3 ade stra e voc izer im, a erteza

evocê enin . A

trar co var a rmali anteferir ropó o, t é a

em que r util d en s pro lidad

 

Page 52: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 52/141

 

Anexo 1

Situação 1

Tomando om N = 5uma amostragem com n = 2 de uma população c

Quantas combinações são possíveis?

( ) ( )10

120

!2

!5

!!

!=

−=⎟

 ⎠ ⎞

⎜⎝ ⎛ 

n N n

 N  N 

n

combinações 12!25

==−

 

População Amostragem

nome idade comb. idade1 idade2  x _ 

   x _ 

p * p  Desvio

  NH 51 1 51 46 4 4,85 38,5 0,1 3,49MIGH 46 2 51 22 36,5 3,650,1 3,97IGH 22 3 51 20 35,5 3,55 2,810,1FGH 20 4 51 12 3 3,151,5 0,1 0,17GGH 12 5 46 22 3 3,404,0 0,1 1,44média 30,2 33,0 3,30 0,786 46 20 0,1desvio 17,21 7 46 12 29,0 2,900,1 0,14

2 28 22 20 1,0 0,1 ,10 8,46  1 1 19 22 12 7,0 0,1 ,70 7,42

1 1 210 20 12 6,0 0,1 ,60 0,16 

µ x _ 

3 88,860,2

σ x _    9,43

µ = 30,2

µ x _ 

= 30,2

Coincidência? Não!

Page 53: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 53/141

 

Anexo 2

Situação 2

Amostragem de n = 3 da população com N = 5

Quantas combinações são possíveis?

( ) ( )10

120

3

!5

!!

!=

−=⎟

 ⎠ ⎞

⎜⎝ ⎛ 

n N n

 N  N 

n

combinações 

idade3

12!35!==

 

População Amostragem

nome idade comb. idade1 idade2  x _ 

   x _ 

* p  Desvio

  NH 51 31 51 46 22 9,67 3,97 8,96MIGH 46 32 51 46 20 9,00 3,90 7,74

IGH 22 33 51 46 12 6,33 3,63 3,76

FGH 20 4 51 22 20 31,00 3,10 0,06

GGH 12 5 51 22 12 28,33 0,352,83

média 30,2 6 51 20 12 27,67 0,642,77

desvio 7,21 7 46 22 20 0,081 29,33 2,93

8 46 22 12 26,67 2,67 1,25

9 46 20 12 26,00 2,60 1,76

10 22 20 12 18,00 1,80 14,88

  µ x _ 

  30,20 39,49

  σ x _ 

  6,28 

µ 

µ

= 30,2

 x _ 

=

oincidência de novo? Não!

30,2

C

Page 54: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 54/141

 

Anexo 3

Situação 3

Amostragem de n = 4 da população de N = 5

Quantas combinações são possíveis?

( ) ( )5

24

120

!45!4

!5

!!

!==

−=

−=⎟

 ⎠ ⎞

⎜⎝ ⎛ 

n N n

 N  N 

n

combinações

População Amostragem

 x _ 

  p  x _ 

n idade idadome e1 idade2 idade3 idade4 * p desvio

  NH 51 51 46 22 20 34,75 0,2 6,95MIGH 46 51 46 22 12 32,75 0,2 6,55 1,301IGH 22 51 46 20 12 32,25 0,2 6,45 0,841FGH 20 51 22 20 12 26,25 0,2 5,25 3,121GGH 12 46 22 20 12 25 0,2 5 5,408

média 30,2 µ x _ 

  14,81230,2

desvio 17,21 σ x _ 

  3,85

µ = 30,2

µ x _ 

= 30,2

Coincidência? Não! Por que não?

1)  Se você usar todas as possíveis combinações, a média da média µ x _ 

 será sempre igual

a média da população µ, independentem te do tamanho da amostragem.

é o desvio padrão da média ou erro padrão, ou seja, conforme aumenta a

intensidade de am e diminui a incerteza

en

2)  O que muda

ostragem, diminui o erro, aumenta a precisão

da sua estimativa.

Page 55: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 55/141

 

CAPÍTULO 7Estim ndo a média da populaça ão

7.1. Intervalos de confiança:

Vimos no capítulo 5 que é razoável usar uma média amostral  x _  para estimar a média

da população ( µ ). A Lei dos Grandes Números diz que: se uma “grande” amostragem

aleatória é tomada de uma população, a  x _ 

“tende” a ser “parecida” com .

  No capítulo 6 discutim que diz: se uma amostragem

µ

os o Teorema de Limite Centralaleatória de tamanho n (n ≥ 30) é tomada de uma população com média µ e desvio padrão σ,

então  x _ 

é (aproximadamente) normalmente distribuída e, por esta razão, podemos encontrar 

as probabilidades para  x _ 

usando as áreas sob a curva normal com parâmetros µ e σ/ n .

E AGORA??  x _ 

  Qual é a confiança sobre a precisão envolvida ao usar para estimar µ ? 

Estamos falando do Intervalo de Confiança (IC), que será definido com exemplos.

Exemplo 1: Um estatístico está interessado em obter informações sobre a média emaltura de uma população, µ , de todos os adultos masculinos de uma grande cidade.

e que o σ é igual a 2,5”. Se ele tomar uma

mostr 

Com base em experiência anterior ele sab

a agem aleatória de 30 adultos, qual é a probabilidade da altura média  x _ 

estar dentro de1” da altura média da população, µ ?

Solução: Queremos encontrar a probabilidade da  x _ 

estar dentro de 1” de µ

 

; que é, P

( <- 1  x _ 

< µ + 1 ). Como n ≥ 30, recorremos ao Teorema de Limite Central para

encontrar as probabilidades para  x _ 

usando as áreas sob a curva normal com parâmetros µ (que não conhecemos) e σ / n = 2,5 / 30 = 0,46.

Então, para encontrar  - 1 <P ( µ  x _ 

< µ + 1 ), precisamos encontrar a área sob aarâmetros µ e ,46) entre µ - 1 e µ + 1.curva normal (com p 0

Desta vez não conhecemos µ - 1 e µ + 1, ao contrário de exemplos anteriores. Mas,

mesmo assim, podemos resolver o problema pela padronização de nossa variável aleatória, daseguinte maneira:

46,0⎟ ⎠

 ⎞⎜⎝ 

⎛ −= µ  x z  

O valor de z  para  x _ 

= µ - 1 é

z = [ (µ - 1) - µ ] / 0,46 = -1 / 0,46 = -2,17

E o valor de z para  x _ 

= µ + 1 é

z = [ (µ + 1) - µ ] / 0,46 = 1 / 0,46 = 2,17

Page 56: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 56/141

 

Da tabela 1, tiramos as áreas sob a curva para z = -2,17 e z = 2,17, que sãorespectivamente 0,0150 e 0,9850. A área, então, compreendida entre -2,17 e 2,17 é:

rea = 0,9850 - 0,0150 = 0,97á

Conseqüentemente,

P ( µ - 1 <  x _ 

  < µ + 1 )  = 0,97 

Quer dizer: a probabilidade da  x _ 

estar entre 1” da µ é de 0,97.

 x _ 

 Vamos colocar a expressão anterior de outra maneira: que a deve estar 1” da µ ,

que é   o mesmo que dizer que “ µ está entre 1” de  x _ 

 .” Isto pode ser re-escrito da seguinte

maneira:

P ( x _ 

 x _ 

  - 1 < µ < + 1) = 0,97Em outras palavras, sabemo  s que se uma amostragem aleatória de 30 adultos masculinos é 

tomada, então a probabilidade do intervalo de  x _ 

 - 1 a  x _ 

 + 1 conter  µ é de 0,97.

Suponha agora, por exemplo, que quando o pesquisador tomar uma amostragem

aleatória, ele consegue  x _ 

= 67”, então

 x _ 

- 1 = 66 e  x _ 

+ 1 = 68

Ele sabe que, 97% destes intervalos conterão µ e, por esta razão, ele pode estar 97% certo de

que a µ estará entre 66 e 68. Desta forma, o intervalo de 66 a 68 é chamado de IC 97% paraµ.

 .2. Especificando o nível de confiança:

da população µ, com

   Na seção anterior vimos como encontrar o IC para uma média

  base na informação obtida de média amostral  x _ 

. No exemplo anterior especificamos otamanho da amostragem e a forma do IC e, com estas especificações, calculamos a confiança.Entretanto, freqüentemente é desejável especificar a confiança a priori.

Exemplo 2: A companhia de telefone está interessada em obter informações sobre o

tempo médio, µ , de cada chamada. Um levantamento preliminar indicou que o desvio padrãoas chamadas é σ = 4,4 minutos. Ao monitorar (não grampear) aleatoriamente 100 chamadas,

= 100, chegou-se a um tempo médio

d

 x _ 

= 5,8 minutos.

 Sabendo que

n

 x _ 

  = 5,8, encontrar o IC 95% para µ 

as previamente) a confiança ésolução para este problema é o inverso do

roced que implica em usar a tabela 1 no sentidoverso z.

Solução

    Nesta questão (ao contrário das questões consideradespecificada a priori: queremos um IC a 95%. A

imento usado para resolver o exemplo 1, o pin , ou seja, você tem a área sob a curva (área = 0,05) e precisa encontrar o valor de

: Encontrar o valor-z, para o qual a área sob a CNP (curva normal padrão) àdireita deste z, é 0,025 (área/2) e à esquerda deo [1 0,025 ] = 0,975 e 0,025. Dessa maneira, para

z. Note que a área total sob a CNP é 1, entãoestam s falando de uma área equivalente a -

 

Page 57: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 57/141

 

resolver este problema precisamos encontrar o valor-z que tem uma área entre 0,975 e 0,025 àsua esquerda.

 Na tabela 1, o valor-z que tem uma área de 0,975 à sua esquerda é 1,96 - no encontro

ela. Se o valor exato não for encontrado, faça interpolações.O valor-z que tem uma área de 0,025 à sua esquerda é -1,96.

da linha 1,9 com a coluna 6, você tem uma área de 0,9750.  Neste caso, você tem o valor exato de 0,9750 (1 - 0,025) na tab

Agora, voltando à companhia telefônica: sabemos que n = 100 e, em função podemos

recorrer ao TLC (teorema de limite central) para assumir que  x _ 

é aproximadamente

normalmente distribuída com µ x _ 

  = µ (que não conhecemos) e o desvio padrão:

44,01004,4 ==n  =− x

σ σ 

Assim, a variável aleatória z terá a seguinte fórmula

( )44,0−=  x z  

e terá aproximadamente uma distribuição normal

P ( -1,96 < z < 1,96 ) = 0,95

 padrão.

Como queremos o IC 95% para µ , podemos colocá-lo da seguinte maneira:

[ x _ 

P ( -1,96 < - µ ] / 0,44 < 1,96 ) = 0,95

P ( x _ 

- 1,96*0,44 << µ   x _ 

+ 1,96*0,44 ) = 0 95,

P (  x _ 

- 0,86 < µ <  x _ 

+ 0,86 ) = 0,95

substituindo o valor de  x _ 

= 5,8, teremos os seguintes intervalos:

 x _ 

- 0,86 = 5,8 - 0,86 = 4,94

e

 x _ 

+ 0,86 = 5,8 + 0,86 = 6,66

Concluindo que o intervalo entre 4,94 e 6,66 minutos é o IC 95% para µ. A companhia podeter 95% de confiança que a duração média de uma chamada, µ, da cidade está entre 4,94 e

6,66 minutos.

 No exemplo anterior encontramos o IC 95%. O número 0,95 é conhecido como o nível e confiança ou coeficiente de confiança. Em estatística, costuma-se escrever 0,95 como 1 -,05. E

 

7.3. Intervalos de confiança para médias: grandes amostras

 d 0 ste número é subtraído de 1 para obter o nível de confiança que é representado pelaletra grega α . Para IC 95%, α = 0,05; para IC 90%, o nível de confiança é α = 0,10 e assim

 por diante.

Page 58: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 58/141

 

Procedimento para encontrar o IC para µ, baseado em  x _ 

:

 Requisitos: (1) n ≥ 30 e (2) σ conhecido

 Passo 1: Se o nível de confiança desejado é 1 - α, use a tabela 1 para encontrar z α/2

 Passo 2: O IC desejado para µ é:

 x _ 

- z α/2 * ( σ / n )  para  x _ 

+ z α/2 * ( σ / n ) 

 x _ 

  onde z α/2 é obtido seguindo o passo 1, n é o tamanho da amostragem e éobtida dos dados da amostragem. 

Exemplo 3: Uma empresa florestal está interessada em obter informações sobre oiâmetro médio, µ , de sua floresta. Um estudo preliminar indicou que σ = 10 cm. O pres

dem ário decidiu verificar esta informação com base em uma amostragem de 30 árvores.

Ele encontrou uma média amostral das 30 árvores,  x _ 

= 40 cm. Baseado nestas informações,vamos encontrar o IC 90% para a µ .

 Solução: Checando primeiro: n ≥ 30 - OK!; e σ é conhecido. Podemos, então,aplicar os passos necessários:

1. O nível de confiança é 0,90 = 1 - 0,90; logo α = 0,10 e da tabela 1 tiramos

z α/2 = z 0,05 = 1,64

2. Desde que z α/2 = 1,64, n = 30, = 10 eσ  x _ 

= 40, o IC 90% para será:µ

 x _ 

- z α/2* σ/ n   a   x _ 

+ z α/2* σ/ n  

substituindo os valores conhecidos

30   a 40 + 1,64 * 10 / 30  40 - 1,64 * 10 /

37 a 43 

nfiança que o diâmetro médio, µ , de suafloresta está ent 7 a

   Até agora ass na maioria dos casos, istonão é possível. a stimar o σ

 

  . Qu

Concluindo: o empresário pode ter 90% de core 3 43 cm.

umimos que o σ é conhecido. Entretanto,Um maneira de lidar com isto é fazer um levantamento piloto para e

er dizer: podemos usar o desvio padrão amostral s no lugar do σ . Isto é aceitáve , para grandes amostras ( n

l orque ≥ 30 ), o valor de s p é extremamente parecido a ser uma

boa aproximação de σ . A conseqüência matemática disso é a seguinte (recorre ): 

ndo tambémoTLC a

ns

 x µ −

em vez de n

 x

σ 

µ −

 

Page 59: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 59/141

 

 E os outros procedimentos são os mesmos apresentados no quadro anterior, substituindoapenas σ    por s .

lo 4

 

Exemp : No Quadro 7.1 são apresentadas informações sobre área basal por hectare

e 30 unidades amostrais (ua) selecionadas aleatoriamente de 2 transectos de 20 x 2.500 m,e aixio. Os procedimentos sãos mesm

ddistribuídos nas seguintes classes topográficas: platô, encosta bos utilizados anteriormente e os resultados são:o

platô => IC (95%) =  x _ 

  ± 2,5 = 31,2 ± 2,5 = 28,7 < µ < 33,6

encosta => IC (95%) =  x _ 

 ± 2,3 = 28,5 ± 2,5 = 26,2 < µ < 30,8

baixio => IC (95%) =  x _ 

 ± 2,1 = 2 5 ± 2,5 = 24,4 < µ < 28,6

O segundo termo após o sinal (±) pode ser considerado como “incerteza” ou “margem

de erro”. Assim, as in s a a i , spectivamente: 0,0799,0,0808 e 0,0785, ou seja a m e ,85%.

o encontrar o IC para µ, quandodamos com grandes amostras ( n ≥ 30 ). Entretanto, em muitos casos, quando grandesmostr 

6,

certeza para pl tô, encost e ba xio são re, s incertezas (e %) são d 7,99%, 8,08% e 7

7.4. A distribuição t (de student):

  Nas seções anteriores deste capítulo vimos comlia as não estão disponíveis, extremamente caras ou, por alguma razão, simplesmenteindesejável, você tem que dar outro jeito porque a curva-z não se aplica nestas condições.

 Neste caso, recorremos à curva-t  em vez da curva-z .

 Detalhe importante: para obter IC para a média da população, a partir de pequenasamostras ( n < 30 ), a população, por si só, tem que ser aproximadamente normalmentedistribuída.

Se n < 30, não podemo CNP par ncontrar a ilidades para o IC.Entretanto, um pesquisador cham .S. Gosset desenvolveu

 podem ser usadas, em vez da CN curvas sã nhecidas c vas-t de student ousimplesmente curvas-t. A form a curva- pende do da amostra. Se aamostra é de tamanho n, nós ide os a curva-t em questão dizendo que é a curva-t com

(n-1) graus de liberdade.Se tomamo uma amostra aleatória de tamanho n população que éaproximadamente normalmente distribuída com mé µ, a variáv ria

s usar a a e s probabado W curvas de probabilidade que

P. Estas o co omo cura de um t de tamanho

ntificam

s de umadia el aleató

( ) ( )ns xt  µ −=  

tem a distribuição-t com (n - 1) graus de liberdade. As probabilidades para esta variávelaleatória po ntrada usando as áreas sob a curvde ser encotabela 2.

a-t com (n - 1) graus de liberdade -

as seguintes propriedades:

As curvas-t variam conforme os graus de liberdade, como ilustrado na figura 7.1.

E as curvas-t têm

 

Page 60: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 60/141

 

  A área total sob qualquer curva-t é igual a 1.torno de zero.

ente em ambas as direções.  Conforme aumenta raus de liberdade, as curvas-t ficam

mais parecidas com a CNP.

 A maneira de encontrar a área s a mesma usada na CNP.

confiança para médias - pequenas amostras:

Vam s s a em

  As curvas-t são simétricas em  As curvas-t se estendem indefinidam

o número de g

ob a curva-t é 

7.5. Intervalos de

 x _ 

,o ver agora o procedimentos para encontrar os IC para µ baseadquando o tama ento comum exemplo.

nho da amostra é menor que 30 ( n < 30 ). Vamos ilustrar o procedim

 

Procedimento para encontrar o IC para µ, baseado em  x

 _ 

:

 Requisitos: População normal

 Passo 1: Se o nível de confiança desejado é 1 - α, use a tabela 2 para encontrar t α/2

 Passo 2: O IC desejado para µ é:

 x _ 

- t α/2 * ( s / n )  para  x _ 

+ t α/2 * ( s / n ) 

onde t α/2 é obtido seguindo o passo 1, n é o tamanho da amostragem e  x _ 

 e s são obtidas dos dados da amostragem. 

Exemplo 4: Um vendedor de pneus está interessado em obter informações a respeitoda durabilidade média ( µ ) de uma nova marca. O fabricante diz que a nova marca foi feita

 para aguentar 40.000 milhas, ou seja, µ = 40.000. O vendedor quer testar, por sua conta, adurabilidade dos pneus.

Para isto, ele decide tomar uma amostragem aleatória de 16 pneus e conferiu a

milhagem de cada um.Os resultados deste teste é o seguinte:

 

Pneu milhagem Pneu Milhagem1 43.725 9 39.7832 40.652 10 44.6523 37.732 11 38.7404 41.868 12 39.3855 44.473 13 39.6866 43.097 14 44.019

7 37.396 15 40.2208 42.200 16 40.742

Page 61: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 61/141

 

Usando estes dados, vamos encontrar o IC 95% para µ, considerando que adurabilidade do pneu é normalmente distribuída.

Solução: Vamos usar o procediment inido rmente; neste caso com n = 16.

1. O nível de confiança desejado é 0.95, isto é, α ,05. Us a tabela 2 para (16-1)

= 15 graus de liberdade.t α/2 = 25 = 2,1

2. O IC 95% é:

o def anterio

= 0 ando

t 0,0 3

 x _ 

n ) para  x _ 

+ 2,13*( s / n- 2,13*( s / )

Dos dados deste exempl dos pne ) temoo ( us s:

 x _ 

= 41.148,13

s = 2.360, 32

Conseqüentemente

e

 

 x _ 

- 2,13*( s / n ) = 41.148,13 - 2,13 * (2.360,32/ 16 ) = 39.891,26

 x _ 

+ 2,13*( s / n ) = 41.148,13 + 2,13 * (2.360,32/ 16 ) = 42.405,00

Isto quer dizer que o vendedor pode ter 95% de confiança que a µ (durabilidade médiada nova marca) está ent 39.891 42.405 as. Desta forma, o fabricante está correto em

afirmar que a nova marca tem µ = 40.000 m s.

re a milh

ilha

 

Page 62: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 62/141

 

Qto

uadro 7.1: Dados de área basal (m2/ha) em dois transectos na ZF-2 distribuídos em classes pográficas (platô, encosta e baixio).

transecto ua platô encosta baixio1 1 41,4 21,8 28,21 2 43,7 28,2 22,1

1 3 26,1 22,1 29,61 4 33,8 14,9 39,31 5 33,3 21,9 43,21 6 37,2 27,5 39,71 7 31,0 30,9 40,71 8 18,6 36,5 22,61 9 33,2 21,9 12,41 10 32,4 28,5 15,81 11 26,2 28,4 25,61 12 41,3 31,5 40,61 13 19,6 32,7 26,41 14 34,8 30,8 21,81 15 27,3 29,9 35,81 16 39,5 23,5 34,61 17 30,1 18,4 20,6

1 18 24,6 18,4 21,11 19 36,6 24,0 24,31 20 34,7 16,3 41,61 21 60,7 15,9 29,61 22 44,7 35,0 41,91 23 26,3 19,9 36,71 24 24,5 31,3 23,51 25 26,6 18,4 27,41 26 22,2 31,1 28,11 27 35,7 11,3 12,31 28 19,4 24,3 23,51 29 17,0 47,0 29,61 30 52,6 24,8 23,42 1 26,6 27,0 6,42 2 36,7 30,9 26,92 3 33,3 23,8 21,1

2 4 20,6 27,9 17,22 5 57,7 28,2 25,22 6 38,8 36,6 23,72 7 43,2 17,6 14,52 8 23,6 33,5 27,72 9 28,4 30,2 28,62 10 17,6 39,9 37,52 11 18,9 38,0 26,12 12 27,6 26,6 25,72 13 47,7 32,7 18,62 14 23,9 56,0 24,22 15 21,1 59,8 19,22 16 22,3 34,7 15,22 17 19,7 29,8 42,32 18 27,4 28,5 20,4

2 19 39,2 25,3 26,12 20 27,7 9,4 27,02 21 28,5 32,3 35,62 22 18,0 31,2 24,92 23 39,0 28,1 25,22 24 28,1 28,1 20,82 25 34,0 39,7 23,12 26 25,3 21,5 24,92 27 26,4 38,7 23,12 28 40,6 29,4 23,52 29 21,3 25,5 21,32 30 31,1 34,0 30,7

média 31,2 28,5 26,5desvio 9,8 9,1 8,2IC(95%) 2,5 2,3 2,1

Page 63: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 63/141

 

 

Curva normal Curva-t com 12 gl Curva-t com 3 gl  

-3 -2 -10 1 2 3 0 1 2 3-3 -2 -1 0 1 2 32 -1  

Figura 7.1.: Diferentes curvas-t com diferentes graus de liberdade (gl).

-3 -

 

Page 64: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 64/141

 

 

Capítulo 8Testes de hipóteses para médias

8.1. Introdução:  No Capítulo 7 aprendemos como fazer uma “predição educada”1 (inferência) sobre

uma média da população µ  olhando a média amostral  x _ 

  de uma amostra aleatória da população. Neste capítulo, vamos fazer o inverso; vamos fazer uma “predição educada” ou

levantar uma hipótese sobre a µ e então vamos usar a  x _ 

para fazer inferência concernente a

nossa hipótese. Em outras palavras, usaremos  x _ 

para decidir se a nossa hipótese concernenteà µ é correta.

 Exemplo 1: O DAP médio da floresta do Distrito Agropecuário da SUFRAMA (área

de 600.0 cm. Vamos ver neste cap dio tomado deuma amostragem aleatória (por ex., n = 30, correspondente a 30 hectares),

00 ha) é µ = 38 ítulo como usar o DAP mé x _ 

, para decidir seaquilo que hipotetizamos (µ = 38 cm) está correto ou não.

Dizemos então que µ = 38 cm é a hi 0), que pode ser escrita da seguintemaneira:

o agora é: como usar a

pótese nula (h

Hipótese nula: µ = 38

Que pode ser testada contra a hipótese de que a µ não é igual a 38 cm, conhecida comohipótese alternativa (h1), que pode ser escrita da seguinte maneira:

Hipótese alternativa: µ ≠ 38

(que pode ser também µ < 38 ou µ > 38)

A questã  x _ 

  para tomar a decisão? A idéia é simplesmente a

seguinte: sabemos que  x _ 

deverá ser aproximadamente igual a µ

 

, ou seja, se µ = 38 

(assumindo que h0 é verdadeira), podemos esperar que a  x _ 

(o DAP estimado) seja “mmenos” igual a 38 cm. E agora? O quão próximo de 38 precisa estar o DAP médio paconsiderado estatistica

ais oura ser 

mente igual a µ? Se a gente olhar para h1, precisamos responder: oara ser considerado diferente da µ? Ou então:

o quão maior – para testar as hipóteses alternativas (µ < 38 ou µ > 38)?, precisamos encontrar um ponto para tomada de decisão, d,

quão distante de 38 precisa estar o DAP médio p

menor ou o quãoMatematicamente falando

tal que se  x _ 

  ≠ d ou se  x _ 

  < d ou se  x _ 

> d, então rejeitamos h0  (µ = 38). Geralmente osites para d antes de rejeitar h0. Os números 0,01 (1%),

te e são geralmente

as hipóteses nula (h0) e alternativa (h1) é bastante subjetiva.Como regra básica podemos dizer que h0 leva sempre o sinal de ( = ); exemplos: µ = 38, µ1 =

µ2 (média da população 1 é igual a média da população 2) e assim por diante.

estatísticos usam 1, 5 ou 10% como lim0,05 (5%) e 0,10(10%) são chamados de níveis de significância do tesdenotados como α.

Como escolher as hipóteses para serem testadas?? 

Em geral a escolha d

 1 “predição educada” pode ser traduzida como um “chute certeiro” de um Romário por exemplo.

Page 65: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 65/141

 

A h1 pode ser quebrada em duas situações:

- teste uni-caudal: neste caso, ou olhamos à direita de d quando temos h1: µ > 38, ou àesquerda de d quando temos h : µ < 38. Outra situação é µ1 < µ2 ou µ1 > µ2. 

neamente à direita e à esquerda de d e o quê

contecer primeiro transforma-se no argumento principal para rejeitar h0 e, neste caso, em vez

de que o nível de significância seja a probabilidade de rejeitar uma h0 será rejeitada quando ela for verdadeira. Conseqüentemente,

e de hipótese, então podemos estar razoavelmente confiantese não podemos rejeitar  h0, isto não prova que h0 seja

ais.

hipótese que é verdadeira

1

- teste bi-caudal: olhamos simulta

ade α nós temos que usar α/2.

Observação: Desverdadeira, é improvável que h0

se podemos rejeitar h0 num testque h1 é verdadeira. Por outro lado, sverdadeira, simplesmente quer dizer que ela é razoável, nada m

Há dois tipos de erros quando aceitamos a hipótese que não é verdadeira, Tipo I e TipoII, que ilustramos no quadro abaixo:

hipótese que é 

 Aceita   H 0 h1

h  0 OK! erro Tipo II 

h1 erro Tipo I OK!

8.2. Montando um Teste de Hipótese: Grandes Amostras

Veremos agora o procedimento para montar um teste de hipótese referente à média de

tamanho da amostragem é considerado grande (n ≥ 30). Paracurva normal padrão (distribuição), vistaando tomamos uma amostra aleatória de n ≥ 30 de uma

riável aleatória tem aproximadamente a distribuiçãoormal

uma população, µ, quando oexecutar este teste podemos recorrer aanteriormente, que diz que qu

  população com média µ, então a van padrão.

( )ns

 x z

µ −=  

8.2.1. Testes de Hipóteses para uma média simples: teste unicaudal para grandes amostras.(i) Olhando apenas o lado esquerdo da curva:

µ µ

Procedimentos:

1. Hipótese nula: = 0 

2. Hipótese alternativa: µ < µ0 

3. Condicionante: tamanho da amostragem n ≥ 30 

4. Escolher o nível de significância2  α. Normalmente α = 0,01, 0,05 ou 0,10

5. O valor crítico é d = - zα. Usar Tabela 1 para encontrar o valor de z. 

2 hoje em dia a maioria dos pacotes estatísticos já dão diretamente o valor exato de α.

Page 66: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 66/141

 

6. Calcular o valor de

( )

( )ns 

 x z 0µ −

=

7. Se z < d, rejeitar a hipótese nula.

(ii) Olhando apenas o lado direito da curva:

Procedimentos:

1. Hipótese nula: µ = µ

 

2. Hipótese alternativa: µ > µ0 

3. Condicionante: tamanho da amostragem n ≥ 30 

4. Escolher o nível de significância α. Normalmente α = 0,01, 0,05 ou 0,10

5. O valor crítico é d = zα. Usar Tabela 1 para encontrar o valor de z. 

6. Calcular o valor de

( )

( )ns z =  

 x 0µ 

7. Se z > d, rejeitar a hipótese nula.

8.2.2. Testes de Hipóteses para uma média simples: teste bi-caudal para grandes amostras.

os dois

nho da amostragem n ≥ 30 

4. Escolher o nível de significância α. Normalmente α = 0,01, 0,05 ou 0,10

5. Os valores críticos são d = - zα

 

/2 e d = zα/2. Usar Tabela I para encontrar os valoresde zα/2.

6. Calcular o valor de 

 

 Neste caso vamos olhar à esquerda e à direita da curva e, por esta razão, temníveis críticos ou pontos de decisão d.

Procedimentos:

1. Hipótese nula: µ = µ0 

2. Hipótese alternativa: µ  ≠ µ0 

3. Condicionante: tama

 

( )

( )ns

 x z = 0µ −

 

  ferença entre Médias de Amostras

de de comparar dois sítios diferentes.Queremos, por exemplo, comparar (querer saber) e o DAP médio da floresta do Distrito

7. Se z < - d ou z > d, rejeitar a hipótese nula.

8.2.3. Testes de Hipóteses para Di  Independentes – Grandes Amostras:

  Neste caso estamos considerando a possibilida

 

Page 67: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 67/141

 

Agropecuário da SUFRAMA (município de Manaus) é igual ao DAP médio da FLONA(Floresta Nacional) do Tapajós (Santarém, Pará).

Estatisticamente podemos fazer isso da seguinte maneira:

Hipótese nula: µ1 = µ2 

Hipótese alternativa: µ1 ≠ µ2 ou µ1 < µ2 ou µ1 > µ2 

sendo: µ1 = média da população 1 (Manaus) e  µ2 = média da população 2 (Santarém).

Agora, vamos usar a  x _ 

de cada população para fazer inferência concernente a nossa

hipótese. Considere  x _ 

1 a média amostral da população 1 tirada de uma amostra aleatória de

tamanho n1 de uma população com média µ1; e  x _ 

2 a média amostral da população 2 tirada deuma amostra aleatória de tamanho n2 de uma população com média µ2. Assumindo tambémque as duas amostras são independentes e, se n1 e n2 são ambas maiores que 30, então avariável aleatória

( )

( ) ( )2221

21

2121  x x

 z

−−⎟ ⎠

⎜⎝ 

−=

µ µ 

 nsns +

 ⎞⎛  −−

tem ap uição normal padrão. Aqui s1 e s2 são os desvios padrões

µ1 = µ2 ), então a fórmula de z fica assim

roximadamente a distribamostrais das respectivas populações.

Agora, se a hipótese nula é verdadeira (

( )

( ) ( )222 z

⎠⎝ =  

2121  x x −−⎟ ⎞

⎜⎛  −

−−

µ µ 

211 nsns +

e tem aproximadamente a distribuição normal padrão.

1 2

encontrar o valor de z. 

Procedimentos:

1. Hipótese nula: µ1 = µ2 

2. Hipótese alternativa: µ < µ  

3. Condicionante: n1 e n2  ≥ 30 

4. Escolher o nível de significância α. Normalmente α = 0,01, 0,05 ou 0,10

5. O valor crítico é d = - zα. Usar Tabela I para

6. Calcular o valor de

( ) ( )2221

21

21

nsns

 x x

 z

+

⎟ ⎠ ⎞

⎜⎝ ⎛  −

=

−−

 

7. Se z < d, rejeitar a hipótese nula.

Page 68: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 68/141

 

Para o teste uni-caudal com hipótese alternativa µ1 > µ2, o procedimento é o mesmoque o anterior, mudando apenas o valor crítico d que é d = zα e, conseqüentemente, a área derejeição da h0 passa a ser z > d.

Para o teste bi-caudal com hipótese alternativa µ  ≠ µ , o procedimento é o mesmo1 2

ta , usando os dois valores críticos e, em vez de α, usamos α/2. A rejeição de h0 se darámbémem função do quê ocorrer primeiro, ou z < d ou z > d.

8.3. Montando um Teste de Hipótese para Pequenas Amostras:

  Nem sempre é possível fazer um trabalho de pesquisa usando uma intensidade de

mostras, e o teste t é o contraparte para o teste z. A única e

as (n < 30), a variávelaleatória não tem a distribuição normal padrão. Mas, se assumirmos que a população queestamos amostrando é aproximadamente normalmente distribuída, então a variável aleatóriatem a distribuição t de Student com (n-1) graus de liberdade. Conseqüentemente, quandoconsideramos populações normalmente distribuídas, podemos fazer testes de hipóteses para

amostragem considerada grande (n ≥ 30), ou simplesmente não tem muitas amostrasdisponíveis, ou são extremamente caras, ou, por qualquer outra razão, são indesejáveis. Paraisso, existe teste para pequenas a

 principal diferença é que, neste caso, temos que comprovar a normalidade de nossos dados.Vimos em capítulos anteriores que para pequenas amostr 

médias usando pequenas amostras, da mesma maneira como foi feito para grandes amostras.

ns

 xt 

−=  

8.3.1. Teste de Hipótese para uma Média Simples de Pequenas Amostras:

nativa: µ > µ0 

tα. Usar Tabela II para encontrar o valor de t com (n-1) gl. 

6. Calcular o valor de

Procedimentos:

1. Hipótese nula: µ = µ0 

2. Hipótese alter 

3. Pressuposto: população normal

4. Escolher o nível de significância α. Normalmente α = 0,01, 0,05 ou 0,10

5. O valor crítico é d =

ns

 xt  0−

=  

7. Se t > d, rejeitar a hipótese nula.

e alternativa µ1 < µ0, o procedimento é o mesmoPara o teste uni-caudal com hipótesque o anterior, mudando apenas o valor crítico d que é d = - tα e, conseqüentemente, a área derejeição da h0 passa a ser t < d.

Para o teste bi-caudal com hipótese alternativa µ1 ≠ µ2, o procedimento é o mesmotambém, usando os dois valores críticos e, em vez de α, usamos α/2. A rejeição de h se dará0

em função do quê ocorrer primeiro, ou t < d ou t > d.

Page 69: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 69/141

 

 

 .3.2.

ndo temos amostras independentes comn1 e n2  ≥ 30. Agora, vamos ver como lidar com este teste quando n1 e n2 são menores que 30.

Assim como no caso de média simples, podemos usar a distribuição t de Student; a diferençaaqui é que, além de assumir que as duas populações são aproximadamente normalmentedistribuídas, temos também que (i) considerar quando as variâncias das populações ( σ1

2 e σ22 

) são iguais e (ii) quando as variâncias não são iguais.

  Neste capítulo vamos trabalhar apenas com a condição de variâncias iguais porquevamos ver como aplicar teste para saber se duas variâncias são iguais ou não, no próximocapítulo. As condicionantes serão as seguintes: (1) amostras aleatórias independentes tomadasde duas populações; (2) as duas populações são aproximadamente normalmente distribuídas;(3) as duas populações têm variâncias iguais.

Recapitulando: quando temos uma única população, usamos o desvio padrão amostral

s como a estimativa do desvio padrão da população σ. Quando trabalhamos com amostrasaleatórias independentes de duas populações com o mesmo desvio padrão da população (i.e.,mesma variância), a melhor estimativa do desvio padrão comum (às duas populações) é

Considerando µ1 = µ2, então µ1 - µ2  = 0 e se a hipótese nula é verdadeira, então tem adistribuição t de Studente com (n1 + n2 – 2) graus de liberdade. 

( )

( ) ( )21

21

1 nns

 x xt 

 p + 1

−=  

Procedimentos:

1. Hipótese nula: µ1 = µ2 

2, Hipótese alternativa: µ1 < µ2 

3. Condicionantes: (i) amostras independentes; (ii) populações normais; (iii) variânciasdas populações iguais.

4. Escolher o nível de significância α. Normalmente α = 0,01, 0,05 ou 0,10

5. O valor crítico é d = - tα. Usar Tabela II para encontrar o valor de t com (n1 + n2 -2)gl. 

6. Calcular o valor de

( ) ( )2

11

21

222

211

−+

−+−=

nn

snsns p  

Onde s1 e s2 são desvios padrões amostrais obtidos de amostragem da população 1 e 2,respectivamente. O subscrito p em sp  é para indicar que estamos referindo a um desviocombinado de duas populações.

Se as populações são normalmente distribuídas e σ12 = σ2

2, então a variável aleatóriatem a distribuição t de Student com (n1 + n2

8 Teste de Hipótese para Diferenças entre Médias de Amostras Independentes (e Variância igual) de Pequenas Amostras:

Vimos anteriormente como fazer este teste qua

 – 2) graus de liberdade.

( ) (( )

)( )2

2

n1

121

11 ns

 x xt 

 p +

−−−=

µ µ  

Page 70: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 70/141

 

( )( ) ( )21

21

11 nns

 x xt 

 p +

−=  

sendo:

( ) ( )2

11

21n

s 222

−−− sn

 

7. t < d itar a ótese .

Para o teste uni-caudal com hipótese alternativa µ1 > µ2, o procedimento é o mesmo

21

++n

1n

nula

s

hipSe , reje

= p

que o anterior, mudando o valor crít ue é d = tα e, conseqüentemente, a área deico dapenas qrejeição p ada h0 assa ser  t > d.

P bi-c pótese iva µ1 ≠ µ2, o procedimento é o mesmoara o teste audal com hi alternattambém de α, usamos α/2. A rejeição de h0 se dará, usando os dois valores críticos e, em vezem funç co t < d d.ão do quê o rrer primeiro, ou ou t >

Page 71: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 71/141

 

Sumá

ndicio

umá

ndicio

rio dos Procedimentos p

ntes h0

rio dos Procedimentos p

ntes h0

ara Testar as

h1

ara Testar as

h1

Hip

 

Hip

 

ó C 

na

ó C 

na

teses Discutidas neste

teste estatístico

teses Discutidas neste

teste estatístico

apítapít

TipoTipo CoCoMédia Sirandes am

mpleostr 

sas)(g 0n ≥ 3

 

µ = µ0

µ >µ <µ  ≠

 µ0 µ0 µ0 

[  x _ 

- µ0 ]z = -------------

[s / n ]Duas Mé

(grandes amostrasdias

)n2

dep(1) n

(2) amos1 ≥ 30,tras in

 ≥ 30endentes

 

µ1 = µ2

µ1 >µ1 <µ1 ≠

 µ2 µ2 µ2 

[ x _ 

1 -  x _ 

2 ]= ---------------------√ [ s1

z ---n2

-]2 / n1 ] + [ s2

2 /Média Si

(PequeAmostr 

mplenasas)

s çãoal

 populanorm

 µ = µ0

µ >µ <µ  ≠

 µ0 µ0 µ0 

[ x _ 

- µ0]t = ------------

[s / n ]Duas Mé

(PequeAmostr 

diasnas

( deps n

as i µ2 µ2 as)

1) amos(2) po

(3) v

tras in pulaçõeariânci

endentesormaisguais

µ1 = µ2

µ1 >µ1 <µ1 ≠

 µ2  [ x _ 

1 -  x _ 

2 ]= ----------------------

s p √ (1t ----

n2 )/ n1) + (1 /

Page 72: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 72/141

 

Capítulo 9Inferências sobre as variâncias

9.1. I 

mos ver os métodos usados para os testes de hipóteses e intervalos deconfiança para a variância. Não confundir com análise de variância (ANOVA), que é utilizada

 para teste (comparação) de médias e será vista no capítulo 11. Vamos apresentar o teste qui-quadrado (χ2) e o teste-F.

ê situaçãoodemos estar interessados em controlar a variação? Já vimos que a média é muito mais

 popular qu erências é feita com base nestaariáve

mplo, temos um grande número dediferen ter um

fornece de um fornecedor de parafuso. O encaixe da roda ao carro, nãoé justo certa margem de segurança tanto no comprimento como naespessura do parafuso. Aquele que fabrica o parafuso fornece para vários outros fabricantes enem sempre consegue fazer os parafusos exatamente iguais. Neste caso, o controle dequalidade pode ser feito usando a inferência sobre a variância, seja do comprimento ou daespessu

9.2. Teste estatístico χ e a curva χ :

ntrodução:

 Neste capítulo va

  Na área florestal, ainda não é comum fazer este tipo de inferência. Em qu p

e a variância; por essa razão, a maioria das inf v l.

  No caso de uma indústria de carro, por exetes fornecedores (parafusos, porcas, rodas, espelhos etc.). Neste caso, podemos

dor de rodas diferentee tem sempre uma

ra.

2 2

  Exemplo 1: Um fabricante precisa produzir parafusos de aproximadamente 10 mm emiâmetro para ajustar em buracos de 10,4 mm. Em princípio, sabe-se que as linhas de

 produ nha 1 émais

O fabricante avisa que a margem de segurança é de 0,1 mm, ou seja, parafusos comdiâmetros variando de 9,9 e 10,1 mm passa pelo controle de qualidade. Chama-se umaestatí que odiâme fora daespec de segurança). Sendo assim, é preciso testar as variâncias antes deapresentar o relatório de controle de qualid

o

Aqui, duas questões precisam ser respondidas: (1) qual é a variância apropriada? (2) seas duas linhas de produção têm a mesma variância, igualmente apropriada?

Margem de segurança igual a 0,1 mm é o mesm ± 0,1mm e variância é de 0,01 mm. Então, para responder a questão 1, formulamos as seguintes

Para aplicar o teste, pr er  

d

ção produzem parafusos com diâmetros que se distribuem normalmente, mas a li barata do que a linha 2.

mstica e ela faz uma amostragem aleatória nas duas linhas de produção concluindotro médio é em torno de 10 mm, mas alerta que um ou outro parafuso pode estar ificação (da margem

ade das linhas de produção. Foram coletados 20 parafusos de cada linha de produção e tomadas as medidas de diâmetro de cada um (Quadr 9.1).

o que dizer que o desvio é de

hipóteses para a linha de produção 2:

 Hipótese nula: σ 2 = 0,01

 Hipótese alternativa:σ 2

> 0,01 

imeiro é preciso estimar σ2 usando s2. Depois, é preciso escolh

o teste estatístico. Neste caso, vamos usar o χ

2

 (qui-dradrado). O χ

2

é uma variável aleatória,isto é, o seu valor depende de uma chance para ocorrer. Tomando diferentes amostras, temos

Page 73: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 73/141

 

diferentes valores de χ2. A maneira de encontrar as probabilidades para χ2 é a mesma usada para determinar as probabilidades para a variável aleatória z.

Se uma variável aleatória de tamanho n é tomada de uma população que énormalmente distribuída com variância σ2, então as probabilidades para a

variável aleatória( ) 2

2

1s

n

σ 

2 χ −

=  

 podem ser encontradas usando as áreas sob curvas especiais conhecidas como curvas de χ2.

As princi ai p s características das curvas χ2 são:

eça no ponto-zero sobre o eixo horizontal e se estende à direita;

m).

ente na Tabela III. A Figura 9.1 apresentatrês d aus de liberdade (GL).

9.3. Testes de hipóteses para uma única variância:

ável aleatória de tamanho n é tomada de uma população

 diferentes para diferentes graus de liberdade;

 a curva com

 não são simétricas;

 a área total sob a curva é igual a 1 (u

 2Os valores de χ podem ser obtidos diretam

iferentes curvas para diferentes gr 

Voltando ao exemplo 1, temos o seguinte:

Suponha que uma varique é normalmente distribuída com variância σ2, então a variável aleatória

( ) 22

2 1s

n

σ  χ 

−=  

tem a distribuição qui-quadrado com (n – 1) GL; ou seja, as probabilidades para a variável aleatória χ2 podem ser determinadas usando áreas sob a curvaχ2 com (n – 1) GL.

 pO nosso exemplo consiste de 20 parafusos escolhidos aleatoriamente da linha de

rodução 2. A variância estimada é s2 = 0,058. Para testar as hipóteses, temos que calcular ovalor de χ2:

( ) 22

0

2 1s

n

σ  χ 

−=  

onde σ02 é o valor de σ2 hipotetizada (neste caso, σ0

2 = 0,01). Queremos saber se esta s2 estámuito longe da σ0

2 hipotetizada ou não, ou seja, se 0,058 é igual a 0,01, do ponto de vistaestatístico. Precisamos também escolher o nível de significância (α).

Para 19 (20 - 1) GL, χ2

0,05 = 30,14 (Tabela III)

Page 74: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 74/141

 

Assim, se a hipótese nula é verdadeira, então a probabilidade que o nosso χ2 calculadoue 30,14 é de 0,05. Em símbolos matemáticos, podemos escrever P(χ2

tabelado >30,14) = 0,05. Dessa m s valores χ2 podem ocorrer apena omo “muito grandes” (Figura 9.2).Como amar 30,14 como valor crítico do teste.

teste de hipótese:

 Hipótese nula: σ 2 = 0,01

 Hipótese alternativa:σ 2

>

Como a amostragem de 20 parafusos da linha de produção 2 produziu s2 = 0,058,os

seja maior do qaneira, se a hipótese nula é verdadeira, o

s em 5% das vezes. Classificaremos os χ2 > 30,14 cem capítulos anteriores, vamos ch

Podemos agora executar o

0,01 

tem

  ( ) ( ) 20,110058,001,0

1201 22

0

2 =×−=−= snσ 

 χ   

Desde χ2 > 30,14, temos que rejeitar a hipótese nula e concluir que σ2 > 0,01 para a

 pro en al tar o teste de hipótese para uma única variância é oseguinte:

1. Definir as hipóteses:

linha de produção 2.

O cedim to ger para mon

- Hipótese nula: σ = σ02 2

- Hipótese alternativa: σ > σ02 2

2. Pressuposto: População normal

3. Definir o nível de significância (α)

4. O valor crítico é c = χ2α com (n-1) GL, obtido na Tabela III

5. Calcular o valor de

( ) 22

0

2 1s

n

σ 

 χ −

=  

onde σ02 é o valor hipotetizado na hipótese nula, n é o número de amostras (ou

observações) e s2 é a variância amostral (estimada).

6. Decisão: Se χ2 > c, rejeitar a hipótese nula.

9.4. Intervalos de Confiança para Variâncias:

  No capítulo 7 aprendemos como encontrar o intervalo de confiança (IC) para uma

média da população, µ, baseado em uma média amostral,  x

 _ 

. Neste seção vamos ver comoencontrar o IC para a variância da população, σ2, baseado em uma variância amostral, s2. Para

Page 75: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 75/141

 

montar o IC, vamos usar o fato que, se uma amostra aleatória de tamanho n é tomada de uma população que é normalmente distribuída com variância σ2, então a variável aleatória

( ) 22

s

σ 

 χ 21n −

 

0

=  

te istribuição qui-quadrado com (n-1) GL.m a d

O r o IC é o seguinte: procedimento geral para monta

1. Pressuposto: População normal

2. Se o nível de confiança desejado é 1 - α, usar a Tabela III para encontrar 

χ2  e χ2

1-α α /2 com (n-1) GL

3. O IC desejado para σ2 é

( )2

2

21 sn −

α  χ para

( )

21

2

21− sn

α  χ −

 

Exercício 1: Voltando ao exemp

ação, σ

lo 1, vamos determinar o IC para a variância da

 popul mada, s2. Vamos usar o nível de significância de 10%

(α = om IC, temos que

olhar  2 e, em vez de α , usamos α/2.

,14

5 = 10,12

90% :

30,14 10,12

0% de confiança, podemos afirmar que a variância da popula ão 2 está entre 0,037 a 0,109 mm.

mos comparar duas variâncias desconhecidas. Neste caso,

melh

-F são:

 as curvas são diferentes para diferentes GL;

e se estende à direita;

2, com base na variância esti

0,10) e podemos escrever como 90% IC . Como estamos trabalhando c

 para os dois lados (caudas) da curva-χ

Primeiro, vamos à Tabela III para encontrar χ2α/2 e χ2

1-α/2 

χ2α/2 = χ

20,05 = 30

χ2

1-α/2 = χ2

1-0,05 =  χ2

0,9

O IC será então

19 x (0,058) 19 x (0,058)

----------------- a -------------------

0,037 a 0,109 ou IC (0,037<σ2<0,109) = 90% 

Em outras palavras: com 9ção de parafusos da linha de produç

9.5. O teste-F e as curvas-F:

  Nas seções anteriores discutimos as situações envolvendo somente uma variância

desconhecida. Há ocasiões que quere

o or recurso é usar o teste-F.

Os valores de F são encontrados usando as curvas-F. Essas curvas dependem dos graus

de liberdade (GL). As características das curvas

 cada curva começa no ponto-zero no eixo horizontal

 

Page 76: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 76/141

 

 não são simétricas;

 a área total sob a curva-F é igual a 1.

As áreas sob as curvas-F são apresentadas nas Tabelas IV (α = 0,01) e VI (α = 0,05).Se for preciso usar outros α, é preciso recorrer aos livros especializados. Para cada α é

  preciso uma tabela diferente porque são necessários valores críticos específicos para cadaombinação de GL.

(i) Us

as independentes de duas populações que sãonorm

tamanho da amostragem da população 1

iância da população 1e n2, variávelaleató

s12 / s2

2

tem a ja, as probabilidades para a variável aleatóriaF pod 2 - 1) GL.

O procedimento geral para montar um teste de hipótese usando o F é o seguinte:

1. Definir as hipóteses:

c

o do teste-F para comparação de duas variâncias:

Imagine duas amostras aleatórialmente distribuídas. Vamos considerar:

n1 =

s12 = variância amostral da população 1

σ12

= var s2

2 e σ22 são os valores correspondentes para a população 2. Se σ1

2 = σ22, então, a

ria

F =

distribuição-F com (n1-1, n2 - 1) GL; ou see ser determinada usando as áreas sob a curva-F com (n1-1, n

- Hipótese nula, H 0: σ12

= σ22

- Hipótese alternativa, H 1: σ12 > σ2

2

2. Pressupostos: (1) amostras independentes e (2) populações normais

3. Escolher o nível de significância α 

4. O valor crítico é c = Fα com (n1 - 1, n2 - 1) GL, onde n1 e n2 são os tamanhosdas amostragens.

5. Calcular o valor de

F = s12 / s2

2;

onde s12 e s2

2 são as variâncias amostrais das populações 1 e 2.

6. Decisão: se F > c, rejeitar a hipótese nula.

Exercício 2: Vamos comparar as variâncias das linhas de produção 1 e 2.

Hipótese nula, H 0: σ12 = σ2

2

Hipótese alternativa, H 1: σ12 > σ2

2

A amostragem foi feita de forma independente e os dados são oriundos de uma

  população normalmente distribuída. Dessa maneira, podemos usar o procedimento dadoanteriormente assumindo α = 0,05.

Page 77: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 77/141

 

Para (19, 19) GL, o valor crítico F (ou c) é aproximadamenteecomenda-se a inversão da fórmula de F-estatístico, mantendo os

2,16. Quando s12 > s2

2 mesmos GL. E o F-

statístico é

F = s = 0,058 / 7,25

Como F > c, podemos rejeitar H anto, σ22

>Como sempre, o procedimento para o uso das d das da curva-F é basicamente o

esmo que para uma cauda, exceto que precisamos de dois valores críticos em vez de um só.este caso, precisamos olhar os dois lados da curva [α/2 α/2)]. No primeiro lado, vamos

ncontrar nas tabelas IV VI, para α = 0,02 e α = 0,10, respectivamente, ou seja, não temosenhum problema. No e anto, o outro a curva (1 ), não á como tirar das tabelas.or exemplo, se vamos finir α = 0,10, um lado da curva (α/2) será 0,05 (Tabela VI) e outro será 1 - α/2 = 0,95. Neste caso, o cálculo do F0,95 pode ser feito da seguinte maneira:

1. Vamos considerar  α = 0,1 seguinte s de iberdade (GL):

r e

22 / s1

2 0,008 =

0, port  σ2

.1

uas caum

 N e (1 -e en nt lado d - α/2 hP deo

 

0 e os s grau lnumerador = 9 e minador = 8deno .

2. Calcular o lad reito da curv , F0,05, 9, 8   bela I, que é igual ao di a, α/2 na Ta V3,39.

3. Calcular, então, o lado esquerdo da curva, 1 F0,95 8, da seguinte- α/2, , 9,

maneira:

- F0,95 para GL = (9,8) é a recípro valor F1-0, 05 com os GL trocadosca do 95 = F0,

(8,9).

- Na Tabela V igual aI, F0,95, 8, 9 é 3,23

- O F0,95, 9, 8 é, então igual a 1 / 3,23 = 0,31 

4. Os valores de F para as duas caudas são: 0,31 e 3,39

Page 78: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 78/141

 

Quadro 9.1: Diâmetros (mm) de parafusos em duas linhas de produção.

Parafuso Produção 1 Produção 21 9,91 10,482 9,97 10,073 9,84 9,894 9,97 10,385 10,18 9,56 10,08 9,957 10,03 9,818 10,02 9,879 9,88 10,1310 10,03 10,0311 10,05 10,2612 10,18 9,73

13 10,06 10,2914 9,98 9,9715 9,91 10,3816 10,07 9,9417 9,98 10,1418 10,1 10,1719 9,99 10,1720 9,97 10,09

Média 10,01 10,06Variância 0,008 0,058

Page 79: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 79/141

 

 

F0

 

Figura 9.1: Curva-F com (3,20) gl

χ2

0 5 10 15 20 25 30 

Figura 9.2: Curva qui quadrado

Page 80: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 80/141

 

Capítulo 10Teste de Qui-quadrado ( χ 2 )

10.1. Introdução:

 Neste capítulo vamos ver um teste estatístico baseado na distribuição de Qui-quadradoχ   2 ), e qui-quadrado. Este teste pode ser usado tanto na estatísticaaramé

lo anterior (Capítulo 9). Aqui, vamos enfatizar a aplicação deste teste para:

sua verdade de campo – distribuição observada - com a distribuiçãoerada.

etro: você usa a cadeia de transição probabilísticaica da floresta de seu interesse. Você usa, por 

anto, em 2003, você tem condições deMarkov é confiável para este tipo de trabalho. Basta comparar a

a ou esperada) e confrontar com medições feitas em 2003(observada). Se der não significante, significa que a projeção é, estatisticamente, igual à

3) e você pode confiar na Cadeia de Markov.

xemplos:

3) Ocorrência de cies nas difer s classes topo cas: im ine que você não  be nada disso, então, vo ai hipotetizar que a distribuição a seguin e: 1/3 das espéciescorrem no platô; 1/3 na encosta e 1/3 baixio. Faça levanta ento em algumas  posseqüências e distrib s espécies de rdo com as classes topográficas. Compare osalores observados – seu tamento – com os valores hipotetizados (1/3, 1/3 e 1/3). Se der 

não significante”, isso izer a distri o de espécies na sua área de trabalho ocorredependentemente das classes topográficas.

(3): se você quiser comparar uma toposseqüência da ZF-2 comma da Reserva Ducke pra saber se essas toposseqüências são homogêneas em relação aistribuição de número de espécies por classe topográfica. Imagine que na ZF-2, a

 ja 30% o baixi ê faz

n sc tribu ô, 32 a e 3 xio.

( conhecido como teste d p trica como na não paramétrica. O teste estatístico χ 2 e a curva χ 2 já foram descritos nocapítu

 

(i) Ajuste de curvas ou de distribuições:

Exemplos:

1) Distribuição de diâmetro: você desenvolve uma função para descrever a relaçãoentre classes de diâmetro e freqüência. Ao testar a confiabilidade dessa função em outra área,

você deve coletar novos dados e produzir a nova distribuição de freqüência. O passo seguinteé confrontar ahipotetizada (desenvolvida em outro local, por outro pesquisador) – distribuição esp

2) Projeção da distribuição de diâmMarkov para fazer a projeção da dinâmexemplo, ano 2000 como hoje e 1997 como seu passado imediato – período de 3 anos – parafazer a projeção para um futuro imediato, 2003. Portavaliar se a Cadeia de

  projeção feita (hipotetizad

verdade de campo (medições realizadas em 200 

(ii) Independência:

E

espé ente gráfi agsa cê v seja to no um mto ua a acov levan

“ quer d buiçãin

 

(iii) Homogeneidade:

Exemplos:

4) Usando o exemplouddistribuição se

a Du e de

40% no platô,

obre a dis

na encosta e 30% n

iç lat

o. Aí, voc o levantamento

2% baicke que ão é 36% no p % na encost no

Page 81: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 81/141

 

Aplica o teste qui-quadrado pra checa ção da Z a da Du Se der  “não ificante”, isso quer dizer as to são homo

10.2. Procedimentos para aplicar os testes em diferentes situações:

Valor esperado => E 

cessários:

ação é grupada de acordo com uma determinada distribuição de probabilidade.

(i) E > 1 e (ii) máximo 20% de E < 5

r se a distribui F-2 é igual cke.sign posseqüências gêneas.

Valor observado => O

O valor crítico c é tirado da Tabela III => c = χ 2 α  => descritos no Capítulo 9 (item9.2).

10.2.1. Qui-quadrado (χ 2 ) para teste de ajuste:

Passos ne

Passo 1: formular as hipóteses científicas:

H0 => A popul

H1 => A população não é grupada de acordo com uma determinada distribuição de probabilidade.

Passo 2: lembrar das seguintes condições =>

Passo 3: Definir o α => 10%, 5% ou 1%.

Passo 4: Determinar o valor crítico c com (k – 1) graus de liberdade, na Tabela III => k =número de grupos ou número de classes de diâmetro.

Passo 5: Calcular o χ 2

( )− E O

2

∑=2 χ   E  

H0 

Imagine uma população de árvores com 120ro.

Passo 6: Decisão => Se χ 2 > c => rejeitar 

Agora, vamos exemplificar com números.indivíduos tendo a seguinte distribuição de diâmet 

classes DAP freqüência probabilidade25 24 0,235 48 0,4

45 24 0,255 12 0,1> 65 12 0,1Total 120 1

usando apenas parte da população (neste casoesentativa. A distribuição de diâmetro dessa

amostr 

  Em seguida, você faz um levantamento40 árvores) e quer saber se a amostra é repr 

agem é apresentada abaixo incluindo a freqüência de acordo com a distribuição da população (n = 120) e o χ 2.

Page 82: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 82/141

 

classes DAP bs. (O) Freq esperada (E) ( O – (O-E)2 / EFreq o E )25 8 50 x 0,2 = 10 (8-10) = -2 0,435 20 50 x 0,4 = 20 (20-20 0,0) = 045 13 50 x 0,2 = 10 (13-10) = 3 0,955 5 50 x 0,1 = 5 (5-5) = 0 0,0

>65 4 50 x 0,1 = 5 (4-5) = -1 0,250 1,5

k = 5 => 5 classes de DAP

H0: A distribuição de probabilidades das classes DAP da amostragem população (n=120).

(n=50) é igual a da

ostragem (n=50) não é igual a da

2 é igual 1,5

ecisão => c (9,49) é maior do que χ  lculad ,5) rtan não reje ar H0. Concluir que aistribuição d m é, estati mmostragem é representativa da população.

0.2.2. Qui-q o ( χ 2 ) para teste de independência ou tabela de contingência.

 Neste caso, vamos trabalhar com linhas (L) e colunas (C). O valor esperado de cada

E = ------------------------------------------

s:

H => As duas características são independentes.

de liberdade, na Tabela III.

H1: A distribuição de probabilidades das classes DAP da am população (n=120).

α = 0,05

Valor crítico c (tabela III com GL = 4) é igual a 9,49

χ 

D 2ca o (1 ; po to, it

d a amostrage stica ente, igual a da população e, por essa razão, aa

1 uadrad

 célula é calculado da seguinte maneira:

(total da linha) x (total da coluna)

total de observações

Passos necessários:

Passo 1: formular as hipóteses científica

0

H1 => As duas características não são independentes

Passo 2: lembrar das seguintes condições => (i) E > 1 e (ii) máximo 20% de E < 5Passo 3: Definir o α => 10%, 5% ou 1%.

Passo 4: Determinar o valor crítico c com (L-1) x (C-1) graus2Passo 5: Calcular o χ 

( )∑= χ 

− E 

 E O2

Passo 6: Decisão => Se χ  > c => rejeitar H0 2

Exemplificando com números: Pesquisa com acidentes em relação ao sexo das pessoasenvolvidas. Veja quadro abaixo com 2 colunas e 3 linhas.

Page 83: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 83/141

 

 local acidente homem mulher totalno trabalho 40 5 45em casa 49 58 107Outros 18 13 31

Total 107 76 183H0: a circunstância de um acidente é independente do sexo da vítima.

H1: a circunstância de um acidente não é independente do sexo da vítima.

Calculando os valores esperados (E):

rimeira linh lu x 10 = 26

rimeira linha e segunda coluna => (45 x 76) / 183 = 18,7

gunda linh ra coluna 107 x 107 183 = 62,6

gunda linh unda coluna

rceira linha e primeira coluna => 31 x 107) / 183 = 18,1

o quadro c b esp o se

te homem mulh tot  

 p a e primeira co na => (45 7) / 183 ,3

 p

se a e primei => ( ) /

se a e seg => (107 x 76) / 183 = 44,4

terceira linha e segunda coluna => (31 x 76) / 183 = 12,9

te

E om os valores o servados e erados é guinte:

local aciden er alO E O E

no trabalho 40 26,3 5 18,7 45em casa 49 62,6 58 44,4 107outros 18 18,1 13 12,9 31

total 107 76 183

O = valor observado e E = valor esperado

Checando: nenhum E é menor do que 1 e não tem E < 5 => OK 

L = 2 => (L-1)(C-1) = (3-1)(2-1) = 2

mos a H0.

10.2.3. Qui-quadrado ( χ 2 ) para teste de homogeneidade

Como para o teste de independência, vamos trabalhar com linhas (L) e colunas (C). Ovalor esperado de cada célula é calculado da seguinte maneira:

(total da linha) x (total da coluna)

E = ------------------------------------------

total de observações

Passos necessários:

Passo 1: formular as hipóteses científicas:H0 => As duas características são homogêneas.

α = 0,01

Valor crítico c (tabela III com GL=2) é igual a 9,21. G

Calcular χ 2 = (40-26,3)2/26,3 + ...... + (13-12,9)2/12,9 = 24,30 

Decisão: χ 2 > c; logo, rejeita

 

Page 84: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 84/141

 

H1 => As duas características não são h

Passo 2: lembrar das seg % de E < 5

10%, 5% ou 1%.

valor crítico c com (L-1) x (C-1) graus de liberdade, na Tabela III.

omogêneas

uintes condições => (i) E > 1 e (ii) máximo 20

Passo 3: Definir o α =>

Passo 4: Determinar o

Passo 5: Calcular o χ 2

( )∑

−=

 E 

 E O2

2 χ   

Passo 6: Decisão => Se χ 2 > c => rejeitar H0 

Exemplificando: Comparando duas cidades estratificadas por cor da pele. Duas amostragens(n = 100 para as duas) são consideradas e o resultado é apresentado no quadro abaixo.

amostragem brancos negros Outros total

cidade 1 83 5 12 100

cidade 2 87 6 7 100

total 170 11 19 200

Calcula

 

ndo o valor esperado (E) para cada célula, o resultado é o seguinte:

amostragem brancos negros Outros totalcidade 1 85 5,5 9,5 100cidade 2 85 5,5 9,5 100total 170 11 19 200

Hipóteses:

H0: Cid

GL=2) é igual a 5,99. GL = 2 => (L-1)(C-1) = (2-1)(3-1) = 2

)2/85 + ...... + 5)2/9,5 =2 logo, não jeita os a 0, ou seja, cidade 1 e cidade 2 têm a mesma

de pele.

ade 1 e cidade 2 têm a mesma % para cada cor de pele

H1: Cidade 1 e cidade 2 não têm a mesma % para cada cor de pele

Checando: nenhum E é menor do que 1 e não tem E < 5 => OK 

α = 0,05

alor crítico c (tabela III comV

Calcular χ 2 = (83-85 (7-9, 1,52 

Decisão: χ  < c;uição de cor 

re m Hdistrib

 

Page 85: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 85/141

 

Capítulo 11álise de Variância – ANOVA

r do nome, a a e de variância (ANOVA) é usada para comparação deimos, anteriormente, que há vários testes usados na comparação de média (teste t,

, Bonferroni, Duncan e c). Por que usar a ANOVA? Usamos a ANOVA quandoueremos compreender melhor a natureza da variação natural das diferentes fontes, além de

compar 

ntes tipos de

ente casualizados.

imentos blocosRESÍDUO (ou

ou múltiplas entradas => aplicação clássica em experimentoso fontes de variação.

aninhada (nested): aplicação em experimentos com parcelas subdivididas

Plot (clássico) ou quando o adapta para análise de parcelas repetidas.gressão: tanto para as regressões lineares (simples e múltiplas) e

e múltiplas) => para explicar o quanto da variação dos dados

ente.

riação estabelecidas,s hipóteses é o teste-

m seguida, apresentamos os quadros auxiliares usados para

 ples entrada:

GL SQ MQ F

An

11.1. Introdução:

Apesa nálismédias. VTukey tq

ar as médias. No fundo, ANOVA é a partição (ou desdobramento) da variação total deacordo com as fontes de variação.

A ANOVA é aplicada para testar hipóteses quando a pesquisa envolve mais de duasmédias. Trata-se de uma ferramenta estatística amplamente utilizada e com um grau desofisticação muito alto. Podemos, de forma muito simplista, definir os seguiANOVA:

a)  ANOVA de simples entrada => fontes de variação ou grupos classificados por umsimples critério como ENTRE os transectos e DENTRO (ou resíduo ou erro) dostransectos => aplicado em experimentos inteiram

 b)  ANOVA de dupla entrada => aplicação clássica em exper casualizados => fontes de variação: BLOCO, TRATAMENTO eerro).

c)  ANOVA de triplafatoriais incluindo as interações com

d)  ANOVA

tipo Splite)  ANOVA para re

não lineares (simplesé explicado pelo modelo utilizado.

f)  MANOVA => análise de variância de várias variáveis, simultaneam

 Na verdade, você arma a ANOVA de acordo com as fontes de vaou seja, desmembrando a variação total; o teste aplicado para testar as suaF (Capítulo 9, item 9.5). EANOVA de simples entrada e para ANOVA de dupla entrada.

ANOVA de sim Fontes de VariaçãoEntreDentro (Resíduo)Total

GL = graus de liberdadeSQ = soma dos quadradosMQ = média quadráticaF = calculado

Page 86: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 86/141

 

 ANOVA de dupla entrada:

Fontes de Variação GL SQ MQ FBlocos

TratamentosResíduosTotal

ina o valor de F dividindo MQentre  pela MQ esmo, você pegava o F calculado e comparavacom o NTRE e DENTRO e nível de significância α). Atualmente, os

ftwa r exato da probabilidade para inferência => então, emvez do , o i te fornecer a probabilidade.

ente, os efeitos dos blocos dos t s. Para isso, você aplica o teste-F para blocos e para os tratamentos,separad  blocos pela MQresíduos e

 para os Q resíduos.

11.2. Procedimentos para aplicar a ANOVA de simples entrada:

= número total de observações (g * k)

ações por grupo

os:

são iguais ou, pelo menos, uma é diferente.

) dados que você vai utilizar => dados mé

lações sã ormais com a m a variância.

inir o nível crítico α 

terminar o valor crítico c = c = Fα m (k-1) GL no numerador e (n-k) GL no

dor.i) Calcular F

Qentre 

F > c, rejeitar 

 Exemplo com aplicação s fórm cessárias para o preenchimento

) Fórmulas:

 No primeiro caso (de simples entrada), você determ. Antigamente, muito antigamente mdentro

Ftabela (função dos GLs Eso res estatísticos vão te dar o valo

valor de F no quadro auxiliar software va

  No segundo caso (de dupla entrada), você quer ver, separadame ratamentoamente. O valor de F para blocos você consegue dividindo MQtratamentos dividindo MQtratamentos pela M

n

  k = número de grupos

g = número de observ

Passos necessári

(i) Formular as hipóteses

H0 => µ1 = µ2 ...... = µn 

H1 => nem todas as µ

(ii Definir os tipos de tricos

(iii) Condições => as k popu o n esm

(iv) Def 

(v) De > co

denomina(v

M

F = --------------

MQdentr 

(vii) Decisão => Se H0 

11.3. da ulas nedo quadro de ANOVA:

a

 

Page 87: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 87/141

 

Variação entre os grupos:

ados => SQentre ou SQE

 

Soma dos Quadr  

( )2 ( )

n

 x

1=

−=n

media xSQE  oui

 g

 xij

i

g

i

ij 2

2

1 1 ∑∑∑ ∑ −⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

= = 

tro dos os

> GL para SQE => (k – 1)

Média Quadrática => MQentre ou MQE

MQE = (SQE) / (k – 1)

Variação den grup : 

os Quadrados = Qdentro Soma d > S ou SQD

∑=

= = ⎠⎝ −=n

i

i i

ijg

 xSQD1

1 12  

> GL para SQD => (n - k)

Média Quadrática => MQ ou MQD

∑ ∑ ⎟⎟⎜⎜k 

ij

dentro

MQD = (SQD) / (n - k)

Teste Estatístico => teste-F

 ⎞⎛  g 2 x

 

F = (MQE)/(MQD)

b) Exemplo 1:

Estamos interessados em comparar a renda média anual de 4 companhiasdiferentes.Vamos às companhias e, aleatoriamente, pegamos a declaração de renda para oImposto de Renda de 5 empregados de cada uma. O resultado é apresentado no quadroseguinte (em R$ 1.000,00):

H0: µ1 = µ2 = µ3 = µ4 empreg CIA1 CIA2 CIA3 CIA4 subtotH1: nem todas µ são iguais 1 46 65 37 11 159

n = 20 2 53 59 13 35 160g = 5 3 54 17 65 57 193k = 4 4 29 18 42 56 145α = 0,05 5 27 37 33 40 137

subtot 209 196 190 199 794 

Quadro auxiliar 

Fontes de Variação GL SQ MQ FEntre 3 37,8 12,6 0,04 

Dentro (Resíduo) 16 5486,6 342,9Total 19 5524,4 

Page 88: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 88/141

 

 SQE = [ (2092 + 1962 + 1902 + ...56 + 40)2 ] / 20 = 37,8 

2 2 .. 562 + 402 ] - [ (2092 + 1962 + 1902 + 1992) / 5 ] = 5.486,6  

1992) / 5 ] – [ (46 + 53 + 54 + ..

SQD = [ 46 + 53 + . 

MQE = 37,8 / 3 = 12,6 

MQD = 5.486,6 / 16 = 342,9

F = 12,6 / 342,9 = 0,04  

Decisão => F0,05 = 3,24 para GL = 3, 16; logo, não rejeitar H0 

c) Exemplo 2: Utilizando os dados do Quadro 7.1 vamos ver se há diferenças entre asestimativas de área basal das diferentes classes topográficas. Neste caso, vamos direto à saída(output) do Systat, que é a seguinte:

Fontes de Variação GL SQ MQ F pEntre classes 2 659,83 329,92 4,005 0,02Dentro (Resíduo) 177 14582,04 82,38Total 179

O resultado da ANOVA mostra p = 0,02. Se usássemos os níveis críticos tradicionais(α = 0,05 e α = 0,01), a conclusão poderia ser a seguinte: as diferenças em área basal entre asclasses topográficas são significantes a 0,05, mas não a 0,01. Com esta facilidade o valor exato de α você deve concluir com aquilo que você está vendo, ou seja, 0,02.

Page 89: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 89/141

 

Capítulo 12Regressão e correlação

12.1 Introdução:

O objetivo da regressão é obter uma expressão da dependência de uma variável Y sobre uma ou mais variáveis independentes X. Tal expressão é, matematicamente, conhecidacomo função, logo, Y é uma função de X. Função é um relacionamento matemático que noscapacita predizer quais valores de uma variável Y, para dados valores de uma variável X.Resumindo: Y = f (X).

A regressão define o relacionamento estatístico entre as variáveis tomadas e, acorrelação, a estreiteza deste relacionamento. Na regressão estima-se o relacionamento de

termos de uma função linear (ou uma outralise de correlação, às vezes, confundida com regressão,

tima-

comportamento de uma espécie ou

ra alguns estudos da estrutura da floresta(distribuição em diâmetro, por exemplo) etc.

a dem mo

12.2. Equações básicas das curvas de ajuste:Linear 

uma variável com uma outra, expressando-se emmais complexa), enquanto que na anáes se o grau para o qual duas ou mais variáveis variam juntas.

Os métodos de regressão são de grande utilidade na derivação das relações empíricasentre vários fenômenos, sendo aplicáveis para: (i) encontrar uma função estatística que possaser utilizada para descrever o relacionamento entre uma variável dependente e uma ou maisvariáveis independentes e (ii) testar hipóteses sobre a relação entre uma variável dependente euma ou mais variáveis independentes. No manejo florestal, o uso da regressão é fundamentalna derivação de modelos matemáticos: (i) para explicar o

 povoamento submetido a um determinado tipo de intervenção; (ii) para desenvolver modelosde crescimento; (iii) desenvolvimento de equações de volume e de biomassa; (iv)desenvolvimento de relações hipsométricas; (v) pa

Ao olhar um povoamento florestal, você pode achar que quanto maiores forem odiâmetro e altura, maior será o volume ou peso da árvore. Entretanto, você não poderá afirmar nada além disso. Com o auxílio da regressão, você será capaz de expressar o relacionamentoentre as variáveis independentes diâmetro e altura e o volume (ou peso) da árvore na formu delo estatístico. Desta maneira, você será capaz de predizer o volume (ou peso) de umaárvore em pé tendo apenas as medições de diâmetro e altura.

Dependendo do número de variáveis independentes, a regressão pode ser simples (umavariável) ou múltipla (mais de duas variáveis) e, dependendo da natureza da equação básica, aregressão pode ser linear ou não linear.

=> bX aY  += => linha reta

tica => Y  =Quadrá ++ => parábola

Cúb

Genéri

Hipérb

2cX bX a

ica => Y = 32 dX cX bX aY  +++= => curva do 3º grau

ca => Y = n xX cX bX aY  ++++= ...2 => curva do n-ésimo grau

ole => ( )bX aY  += 1  

Exp

Geomé

onencial => Y = bX aeY =  

trica => Y = baX Y =  

Page 90: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 90/141

 

Todascoeficientes de regressão podem ser obtidos usando procedimento tradicional de regressão

mento dos dados. Entretanto, quandotem ar com processos iterativos para

oeficientes de regressão ede correlação para a regressão linear simples. Sabendo como estimar os coeficientes de

nal e estimar os coeficientes de regressão e correlação utilizando um dos

o relacionamento entre os valores x e y, o primeiro passo émarcar os valores num sistema de coordenadas feito para dar uma evidência visual dorelacionamento das duas variáveis. Se existir um relacionamento simples, os pontos marcados

o é fraco, os

as equações básicas podem ser linearizadas e, deste modo, as estimativas dos

linear. Este “truque” é utilizado para facilitar o processase recurso da informática que permite trabalhconvergência das estimativas dos coeficientes, o “truque” perde o sentido.

 Neste capítulo, vamos demonstrar como são estimados os c

regressão e correlação da simples, você poderá, por analogia, estimar os coeficientes daregressão múltipla. No caso de regressão não linear, há duas alternativas: (i) linearizar aequação original e adotar os procedimentos das regressões simples ou múltipla e (ii) manter aequação origiseguintes métodos: Gauss-Newton, Quasi-Newton e Simplex – opções do software Systat.

12.3. Regressão linear simples:

Para se ter uma idéia de regressão linear simples é necessário considerar uma

 população com n indivíduos, cada um com características xi e yi. Se a informação desejada éuma expressão numérica para

. Isto é

tenderão a formar um modelo (uma linha reta ou uma curva). Se o relacionament pontos serão mais dispersos e, o modelo, menos definido.

Uma linha reta representa a regressão linear simples, a qual é geralmente definida pelaequação

bX aY  +=  

sendo: a = coeficiente de interseção (onde o valor de X corta o valor de Y) e b = coeficienteangular ou de inclinação (estimativa de Y para cada unidade de X acrescentada) – Ver figura12.1. Em regressão, um relacionamento funcional não significa que, dado um valor de X, ovalor de Y tem que ser igual a a + b X, mas que o valor esperado de Y é igual a a + b X.

Em um exemplo real, as observações não permanecem perfeitamente ao longo da linhade regressão. Isto é devido ao erro aleatório (ε) e outros fatores não quantificáveis. A formamais utilizada de ajuste dos dados à linha reta (regressão linear simples) é por meio dométodo dos mínimos quadrados (MMQ), que requer uma soma mínima dos desvios aoquadrado, entre os pontos observados e os estimados (sobre a reta).

(i) Condicionantes para o uso da regressão linear:

  - Homogeneidade da variância => a variância de Y sobre a linha de regressãoé a mesma para todos os valores de X. Isto pode ser resolvido aplicando o testede Bartlett.

  - Normalidade => o simples ajuste dos dados à regressão (ou a descrição dorelacionamento entre as variáveis Y e X) não requer a distribuição normal de

 precisol

(Capítulo 6).

  - Independência

Y, mas se a análise de variância for realizada (o que é óbvio), écomprovar a normalidade ou utilizar o expediente do teorema de limite centra

=> independência dos erros (afastamento da linha deregressão) das observações. A validade desta condicionante é melhor 

eio de seleção das unidades de amostra de forma aleatória. Noassegurada por m

 

Page 91: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 91/141

 

caso de usar parcelas repetidas ou série temporal, o teste Durbin-Watson é asolução.

i) Método dos Mínimos Quadrados (MMQ):(i

Assume-se, tentativamente, que a linha de regressão de variável Y sobre a variável X 

tem a forma a + b X, que assume a seguinte expressão matemáticai X Y  ε  β  β  ++= 10  

o que quer dizer: para um dado X, um valor correspondente de Y consiste do valor  β0 + β1 X mais uma quantidade εi, o incremento pelo qual algum indivíduo Y pode desviar-se da linhade regressão.

tes β0 e β1 são desconhecidos. O erro εi é muito difícil de ser encontrado porque ele varia para cada observação Y  β0 e β1  permanecem fixos e, apesar denão poder encontrá-los exatamente sem das as possíveis ocorrências de Y e X,

utilizar as informações disponíveis para obter as estimativas a e b de β0  e  β1,

respectivamente. Desta maneira, pode o modelo acima, como um modelotico da seguinte maneira

nde Ye é o valor estimado de Y para um dado X, quando a e b são conhecidos.

terminar os coeficientes a e b. Como falamosanteriormente, será uti tes. Vamos fazer esta

nstração a partir da figura 12.1.:

Os coeficien. Entretanto,

o exame de to pode-se

mos escrever estatís

bX aeY  +=  

o

A questão, agora, é saber como delizado o MMQ para a determinação dos coeficien

demo

 

Figura 12.1: Valores ados pela regressão.observados versus valores estim

 

Page 92: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 92/141

 

Vamos considerar 

Yei = valor estimado

 Nesta figura temos 6 valores de X. A equação da reta ajustada passa exatamente entreos pontos (X) observados. O desvio (ε) é a diferença entre o valor observado (Y) e o valor estimado (Ye) pela equação da reta para o mesmo valor de X

Vamos começar a demonstração adiantando que vamos chamar a soma dos desvios ao

εi = Yi - Yei 

sendo:

Yei = a + b Xi 

logo

εi = Yi – (a + b Xi)

 

Continuando o desenvolvimento do MMQ.

(ε1) + (ε2) + (ε3)2 + ... (εn)

2 tem que ser mínimo

goS = ∑ (ε )2 = ∑ (Y – Ye )2 tem que ser mínimo

O passo se rivar esta expressão S para a e b, da seguinte maneira:

Como S tem ualados a zero, tal que as estimativassejam dadas da seguinte maneira:

-2 ∑ ( Yi – a – b Xi) = 0

∑ Yi – a ∑ – b ∑ Xi = 0

∑ Xi Yi – a ∑ Xi – b ∑ Xi2 = 0

e, finalmente, temos as seguintes equações norm is:

Yi = valor observado

.

quadrado de S e S tem que ser mínimo (zero), assim

∑ (εi)2 = S = 0 => i variando de 1 a n 

sem esquecer que

2 2

loi i i

e

S = ∑ (Yi – (a + b Xi))2

guinte é de

δS/δa = 2 ∑ ( Yi – a – b Xi) (-1)

δS/δb = 2 ∑ ( Yi – a – b Xi) (-1Xi)

que ser mínimo, δS/δa e δS/δb podem ser ig

-2 ∑ Xi ( Yi – a – b Xi) = 0

e dividindo tudo por (-2) e completando as outras operações algébricas, as expressões ficamassim

a

 

Page 93: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 93/141

 

 

a ∑ Xi + b ∑ Xi = ∑ XiYi

serão:

a n + b ∑ Xi = ∑ Yi

2

Pelo método de substituição, os coeficientes

( ) n X bY a ii∑ ∑−= −  

e

( ) x xy

SQC SPC b =  

stimar os coeficientes de regressão a e b, você tem que saber os seguintesfacilitar os cálculos manuais, monte a seguinteo encontradas no Capítulo 3.

obs Y X Y X XY (Y-Ye)

Então, para esomatórios: ∑ Yi, ∑ Xi, ∑ XiYi e ∑ Xi

2. Paraquadro auxiliar. As fórmulas de SPC e SQC sã

Quadro 12.1: Quadro auxiliar para estimar os coeficientes de regressão.

2 2 2

1

2

.

.

.

N ∑ XY ∑ (Y-Ye)2

∑ Y ∑ X ∑ Y2

∑ X2

 

Comentários:

i)  Com os coefi ondições de descrever oriável dependente Y e a independente X. Mais parae estima o coeficiente de correlação e a precisão da

equação.

isto é, quando X = Xmédio tem-

iii) oeficiente angular ou de inclinação, fornece a

12.4. C 

rificar o quão estreitoé o relacionamento linear entre as variáveis Y e X. De uma amostragem aleatória (X e Y) de

manh

cientes de regressão estimados temos crelacionamento linear entre a vaa frente, vamos mostrar como s

ii)  A reta dos MMQ passa pelo ponto (Xmédio, Ymédio),se Ye = Y  médio

  O coeficiente de regressão b, cvariação que ocorre em Y, por unidade de X.

orrelação linear:

Depois da determinação dos coeficientes de regressão, vamos ve

ta o n de uma população normalmente distribuída, a estimativa do coeficiente decorrelação, r, é obtida da seguinte maneira:

Page 94: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 94/141

 

Y  X 

 xy

SQSQC  × C 

SPC r =

 

e de correlação tem o m nal do n dor e, conse ntemente, oiciente de são s r independe das unidades de medida das

el ar  

aior res de o relacionad com os maiores valores de Xenores de X.

linear. O passo

i i i i ӯ)]2

= ∑ [(Yi - ӯ)2 – (Yei - ӯ)2 – 2 (Yi - ӯ) i - ӯ)]

2

∑ ( Yi – Yei)

2

= ∑ (Yi - ӯ)2

– ∑ (Yei - ӯ)

2

tal que, o resultado final desta operação é

∑ (Yi - ӯ)2 = ∑ ( Yi – Yei)2 + ∑ (Yei - ӯ)2

SQCY = SQRES + SQREG

Qual é o significado de cada termo?

∑ (Yi - ӯ)2 => SQCY = soma dos quadrados corrigidos de Y

∑ ( Yi – Yei)2 => soma dos quadrados sobre a regressão = SQRES 

∑ (Yei - ӯ)2 => soma dos quadrados devido a regressão = SQREG 

O coeficient esmo si umera qüemesmo sinal do coef variáveis Y e X. 

regres b. E mai , o

O coeficiente de corr ação v ia de -1 a +1 

r positivo => os m es valo Y estã osou os menores de Y estão relacionados com os m

  r negativo => os maiores valores de Y estão relacionados com os menores valores deX ou vice-versa. 

r = 0 => Y não tem relacionamento linear com X.r = 1 => perfeito relacionamento linear entre a variável dependente (Y) e a

independente (X).

12.5. Precisão da regressão estimada:

Depois de estimar os coeficientes de regressão e de correlação, podemos descrever orelacionamento entre Y e X e sabemos o quão estreito é este relacionamentoseguinte é saber o quão precisa é a equação resultante. Primeiro, considere a seguinteidentidade

Yi - Yei = ( Yi -  ӯ ) - ( Yei -  ӯ )elevando ao quadrado os dois lados e somando de i = 1 até n, tem-se

∑ (Y - Ye )2 = ∑ [(Y - ӯ) – (Ye -

 – (Ye

= ∑ (Yi - ӯ)2 – ∑ (Yei - ӯ) – 2 ∑ (Yi - ӯ) – (Yei - ӯ)

e re-escrevendo o 3º termo de modo a ter 

Page 95: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 95/141

 

Portanto, em análise de variância (ANOVA), a grande vantagem é a possibilidade dedecompor a variação tota . Estes são os principaiselementos para montar o qu ara regressão:

l (SQCY) em outras fontes de variaçãoadro de análise de variância (ANOVA) p

 

Quadro 12.2: Quadro de análise de variância (ANOVA)

Fontes de variação GL SQ MQ F

Devido à regressão c – 1 b * (SPCxy) SQREG/(c-1)

Sobre a regressão (resíduo) n – c por subtração SQRES/(n-c)

Total (corrigido) n - 1 SQCY

sendo: c = número de coeficientes de regressão.

a-F). Portanto, hoje você pode tomar decisões baseadas na sua

dual, baseada em (n-2)

o com a qual qualquer valor observado de Y poderia ser estimado de um dado valor de X, usando a equação ajustada.

r a variável que mede a precisão da equação ajustada que

O valor de F é dado pela razão entre MQREG e MQRES. Quanto maior for o numerador MQREG, maior será o valor de F. Quanto maior for o F, mais significante será o modelotestado. Antigamente, você pegava o F calculado e ia à tabela-F para comparar os doisvalores; se o valor calculado fosse maior do que o tabelado (para os 3 principais níveiscríticos de 10%, 5% e 1%), você concluía que o seu modelo era significante, caso contrário,não significante. Hoje, os programas de estatística já dão os valores exatos da probabilidade(ou a área sob a curv

capacidade de discernimento. Por exemplo: se p for igual a 0,03 (ou 3%), você pode dizer que é significante a 5% mas não a 1% ou, então, dizer qualquer coisa sobre o 0,03 da sua própria cabeça sem ficar no maniqueísmo do significante ou não significante.

A MQRES é igual a s2 e fornece uma estimativa da variância resigraus de liberdade (GL). Se a equação de regressão foi estimada de um número grande deobservações, a variância residual representa uma medida do err 

Por último, vamos apresentaé o erro padrão de estimativa (SY.X): 

2

. ss  x y =  

13 será visto como se trabalha com equações múltiplas. Um exemplo No Capítulo prático será visto no Capítulo 15 (biomassa florestal), que é o manuscrito de um artigo já publicado na Acta Amazonica.

Page 96: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 96/141

 

Capítulo 13Estatística não Paramétrica

atística paramétrica. Basicamente, anormal. No entanto, os

nôme rão (µ = 0 e σ2 = 1) e,ão – uso da padronização da

do os seus dados teimam em não seguir a distribuição normal, temos“teorema do limite central” para “driblar” a condição

aram os recursos estatísticos para analisar os seus resultados,

” violadas. Além disso, quando não dá para repetir a pesquisa de campo ou de

 plicados às populações com qualquer distribuição.

  preço é amitação de sua comunicação. Não dá pra você ir muito longe com as decisões tomadas com

 base nos teste tanto, aestatística não paramétrica requer poucos dados (portanto, a pesquisa é mais barata), oscálculos são s nsformações) com dados

rdinais e qualitativos.

A estat e não trabalha com parâmetrose σ2). EsteHoje, quando v

ste similar na nã aração de médias.

 Neste capítulo m paramétricos, principalmente aqueles quetêm contrapartidas (correspondentes) na estatística paramétrica.

13.2. Distribuição n

Este te

Sabem

n−

 

  Numa pesquisa incluindo n

13.1. Introdução:

Até o capítulo 12, vimos várias situações da estestatística paramétrica foi desenvolvida sob a teoria da distribuiçãofe nos naturais tendem a não seguir a distribuição normal padmuitas vezes, não há nem como normalizar os dados da populaçvariável aleatória. Quanainda o recurso do uso donorma“ lidade” da maioria dos testes estatísticos.

Se você achou que acabrestou o último e derradeiro recurso que é o uso da estatística não paramétrica. A estatísticanão paramétrica é usada quando as condições impostas ao uso da estatística paramétrica são

“muitolaboratório e você tem que analisar o material que você em suas mãos. Para alívio de suaconsciência, existe a estatística não paramétrica que é a estatística de distribuição “livre” e osseus testes podem ser a

Qual é o preço que você paga por usar a estatística não paramétrica? Oli

s não paramétricos, além do “significante” ou “não significante”. No en

imples e você pode trabalhar diretamente (sem trao

 (µ ística não paramétrica é assim conhecida porquconceito, no entanto, ganhou uma certa flexibilidade com o passar do tempo.iola as condições impostas pela estatística paramétrica, você corre atrás de um

o paramétrica e usa até para compte

va os ver alguns testes não

Bi omial:

ste já foi visto no capítulo 4 (Probabilidade).

os, então, que:

( ) (k   p pk  xP −⎟⎟ ⎞

⎜⎜⎛ 

== 1 )  pn

k  ⎠⎝ 

experimentos independentes do tipo “sucesso einsucesso”, teremos:

p = pro

  x = o núme

 babilidade de sucesso

ro de sucessos

Page 97: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 97/141

 

  (1 - p) = probabilidade de insucesso

sala tem cartões numerados de 1 a 10. Ela pegam outra sala) tenta “adivinhar” o número que foi

P (x = 2) = ? => probabilidade de acertar 2 vezes

0,027  

ou seja, a probabilidade de outra pessoa acertar 2 vezes em 3 tentativas é 0,027 ou2,7%.

 bilidades, desde que haja coincidência em termosde n

Exemplo 1 => Uma pessoa em umaum cartão ao acaso e uma outra pessoa (e

 pego. Este experimento é repetido 3 vezes. A pergunta é: qual é a probabilidade de acertar 2vezes.

Resolvendo => sabemos que:

n = 3

 p = probabilidade de sucesso = 1/10 = 0,1

q = (1 – p) = probabilidade de insucesso = 9/10 = 0,9

Portanto:3

P (x = 2) = (1/10)2 (9/10)3-2 = 3 * 0,01 * 0,9 =

2

A Tabela VIII dá direto essas proba, k  e p. Pra se garantir, é melhor saber como calcular a probabilidade exata da

distribu

Você obtém a probabilidade usando a Tabela VIII => n = 3, k = 2 e p = 0,1

  na primeira coluna tem o n

ição binomial.

(número de tentativas ou experimentos)

  na segunda coluna tem o k   (número de sucessos)

  para n = 3, temos k = 0, k = 1, k = 2 e k =3

  para cada k , temos uma probabilidade de acordo com a probabilidade desucesso, p, pré-estabelecida =>

o   pra k = 2 => p = 0,0270

> p = 0,0010

  babilidades de sucessos (nãoincluindo k = 2), ou seja, 0,7290 + 0,2430 = 0,9720 => A

nenhuma vez é de 0,9720 ou

o   pra k = 0 => p = 0,7290o   pra k = 1 => p = 0,2430

o   pra k = 3 = 

Respondendo, então, a pergunta: P (x = 2) = ?

P (x = 2) é igual a 0,0270 

E se eu quisesse saber: P (x < 2) e P (x ≥ 2)

  P (x < 2) => fácil, basta somar as pro

  probabilidade de acertar uma ou97,2%.

Page 98: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 98/141

 

  P (x ≥ 2) => tenho que somar a probabilidade de k = 2 e k = 3, ouseja, 0,0270 + 0,0010 = 0,0280 => a probabilidade de acertar mais

13.3. Tes “ranke

miliar. F não aipótes resultado

é o seg

de 2 vezes é de 2,8%.

te de sinal para medianas:Mediana é valor da variável aleatória que, em ordem crescente ou decrescente, está

ado” no meio. Vamos ilustrar a aplicação desse teste com um exemplo sobre rendaixo (arbitro) ou hipotetizo uma renda familiar e vou verificar se rejeito oufa

h e. Pego, aleatoriamente, 12 famílias e registro a renda anual de cada uma e ouinte (em R$ 1.000,00):

60,0 25,7 22,4 20,1 17,3 16,1 15,3 14,8 14,3 14,1 10,4 6,2  > 14.000  < 14.000 

o estamos trabalhando com a mediana, sabemos que:om 

   probabilidade de insucesso => q = (1-p) = 0,5 (menor do que a mediana)

VIII para calcular a probabilidade, considerando que:

 

  aiores do que 14.000) => de acordo com H0, sucessoignifica que a renda tem que ser menor que 14.000; renda > 14.000 significa

 p = 0,5 e, conseqüentemente, q = 0,5

  Neste caso, temos também que fixar (aproximadamente) o nível crítico α paraestabelecer a área de ossa hipó ula.

Então, vamos a tabela VIII

  temos que olhar na primeira coluna com n = 12 (temos 12 rendas familiares,gina, o k está na segunda coluna e como p = 0,5 (sucesso) temos que ver 

as probabilidades de cada k na oitava coluna.

  um processo inverso,a nossa área de rejeição e seu correspondente k  que seria, então, o

nosso valor crítico a ser usado na tomada de decisão.

C   probabilidade de sucesso => p = 0,5 (acima da mediana)

Quais são as nossas hipóteses?

  H0: Mediana (MD) = 14.000

  H1: MD > 14.000

Podemos utilizar a Tabela

n = 12

k = 10 (são 10 rendas msinsucesso.

rejeição de n tese n

terceira pá

como o nosso α = 0,05 (aproximadamente), temos que, ndeterminar 

 

Page 99: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 99/141

 

   pra k = 12 => p = 0,0002 e α = 0,0002    pra k = 11 => p = 0,0029 e α = 0,0002 + 0,0029 = 0,0031 

ser k = 10 ouk = 9, ou seja, se o número de famílias que têm renda maior ou igual a R$00,00 igual a 1 ê rejeita H ,019 ou

0 para α = 0,0729.

oltando ao lo, n = 12 e v s atribuir o sinal (+) para as rendas superiores(-) para as rendas inferiores a 14000.

25,7 22,4 17,3 16,1 14,8 14,3 ,1 10,4 6+ + + + + + + -

Quantos sinais (+) temos? Temoerando α = 0,0192, temos que rejeitar H0 porque k ≥ 10. Como o k só pode

o estaria entre 0,0192 e 0,0729.

3.4. T 

ento” é feito a partir disso.

  nho n

   pra k = 10 => p = 0,0161 e α = 0,0031 + 0,0161 = 0,0192    pra k = 9 => p = 0,0537 e α = 0,0192 + 0,0537 = 0,0729 

  Se a opção for α = 0,05 (aproximadamente), o seu valor crítico pode

14.0 for maior ou 0 voc 0 para α = 0 2 e se for maior  igual a 9, você rejeita H

   V exemp amo

ao valor hipotetizado (14.000) e o sinal

60,0 20,1 15,3 14 ,2+ + + -

  s 10, ou seja, o nosso ponto de decisão é 10 =>Considser inteiro, o nosso valor crític

   Conclusão: Rejeitamos H0, a nossa mediana não é igual a R$ 14.000,00 com α =

0,0192.

1 este de sinal-rankeado Wilcoxon:

É um teste similar ao anterior, mas a operação é executada usando as diferenças entre

o valor observado e o valor hipotetizado. E mais: as diferenças são expressas em valoresabsolutos e o “rankeam

Procedimentos:

  Formular as hipóteses

H0: MD = M

H1: MD < M (MD > M)

Em uma amostra de tama , usar a Tabela IX para encontrar α e o valor crítico

d.

ostra de tam nTomar uma am anho e montar o seguinte quadro:

val o | D | rank de |D| rank c/ sinal R    bs (x) dif (x – M)x1

xn

  Calcular:

1

 para H1: MD > M => R - = soma dos R com sinais negativos para H : MD < M => R + = soma dos R com sinais positivos

Page 100: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 100/141

 

  Decisões:

 para H : MD < M =>1

a H1: MD > M =>R + ≤ d => rejeitar H0

 par R  - ≤ d => rejeitar H0

Vam amos o DAP de 8 árvores (isso é uma coisa quevocê nunca vai fazer – entrar na floresta e medir apenas 8 árvores é um desperdícioinaceitável a mediana é igual a 50 cm. O quadro seguinte apresenta osdados o 

val o M) | D | rank de |D| rank c/ sinal R  

os a um exemplo prático. Tom

) e queremos saber se bservados (x) e as demais colunas necessárias para a execução do teste.

  bs (x) dif (x – 50,2 + 0,2 0,2 2 + 250,1 + 0 0,1 + 1,1 149,6 0,4 - 3- 0,4 349,5 - 0,5 - 40,5 449,2 - 0,8 - 50,8 549,0 - 1,0 - 61,0 648,4 - 1,6 - 71,6 747,0 - 3,0 - 83,0 8

Solução:

  Da tabela IX, para n = 8, tiramos que o α

 mais próximo de 0,05 é 0,055; portanto o

valor crítico d é igual a 6 para α = 0,055.  Calculamos, então, o R + somando os “ranks” com sinais positivos (+) => na última

s (+), que são 2 e 1, logo R + = 2 + 1 = 3 

  Decisão: Como d = 6 e R +

= 3, rejeitamos H0 

3.5. Teste de Mann-Whitney: comparação de duas medianas (ou médias deduas p

Procedimentos:

coluna tem apenas 2 rank 

 

1opulações):

  Formular as hipóteses:

H0: As duas populações têm a mesma mediana => MD1 = MD2 

H1: As duas populações não têm a mesma mediana => MD1 > MD2 (ou menor)

  Considere n como o tamanho da amostra da população 1 e k como o tamanho dao

  a alor crítico d

am stra da população 2.

Us r a Tabela 13.11 para encontrar o v para α = 0,05.

  é a soma dos ranks da população 1.

 

 

Exe tratamentosdiferenciados:

Pop 1: tempo de aprendizagem para todos os trabalhadores com experiênciaomprovada.

Coletar os dados, rankear e calcular S1 que

Calcular T = S1 – [ n (n+1) ] / 2 

Decisão: Rejeitar H0 se T ≤ d 

mplificando: Considere duas populações de escolas com

c

 

Page 101: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 101/141

 

Pop 2: tempo de aprendizagem para todos os trabalhadores sem experiênciacomp vada

  Hipóteses:

H0: MD1 = MD2 

H1: MD1 < MD2   Tamanhos das amostras =>

n = 8 da população 1

k = 7 da população 2

  Da tabela 13.11, para α = 0,05, n = 8 e k = 7, o valor crítico d

ro

é igual a 13.

Vamos aos cálculos:

População 1 População 2

Tempo rank tempo rank 2,33 11 2,31 101,81 5 1,96 72,17 8 2,73 141,78 4 2,51 131,74 3 3,04 151,46 1 2,34 121,58 2 2,24 91,92 6

  Prim  Calculamos, então, o T 

T = 40 – [ 8 (8+1) ] / 2 = 4

Decisão

eiro, calculamos S1 = 11 + 5 + 8 + .....+ 6 = 40

: Como T < d; rejeitamos H0 e concluímos que MD1 < MD2

13.6. Considerações finais:

Evidentemente, a estatística não paramétrica não se resume nos testes apresentadosneste capítulo. Isso foi apenas um aperitivo acrescentado a sua disciplina de BiometriaFlorestal. Estatística não paramétrica tem um vasto repertório de testes; por exemplo, do tipoKolmogorov-Smirnov:

o  Teste Kolmogorov para ajuste da distribuição

o  Teste Lilliefors para normalidade

o  Teste Shapiro-Wilk para normalidade

o  Teste Smirnov para teste de 2 amostras independentes

o  Teste Cramér-von Mises para teste de 2 amostras independentes

o  Teste Birnbaum-Hall para teste de várias amostras independentes

Page 102: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 102/141

 

 

PARTE 2

Page 103: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 103/141

 

 

Capítulo 14Algumas variáveis aleatórias utilizadas em manejo florestal 

14.1 Diâmetro à altura do peito (DAP)14.1.1 Notas preliminares

 Na engenharia florestal, o diâmetro da árvore é DAP e ponto final. DAP se mede a 1,3m acima do nível do solo. O objetivo desta seção não é ensinar como medir o DAP porqueisto está muito bem explicado nos livros de Machado & Figueiredo Filho (2003)3 e Campos &Leite (2002)4. Em plantios de eucalipto, o DAP tende a ser medido quase sempre a 1,3 m dosolo. Na Amazônia, a situação é um pouco diferente porque há sapopemas e outrasirregularidades no tronco que nem sempre a parte a 1,3 m do solo está disponível para medir.

ica ocasião, esta situação pode ser superada utilizando

u a projeção do diâmetro à altura do DAP. Por compensação decontínuos, a subjetividade naediçã ão é bem-vinda. Neste caso, é

ura em relação ao solo) e aí o recurso é medir ste ponto da medição. Dessa forma, será possível

stimar ou mais ocasiões.

rreta desta variável tão importante para a engenharia florestal;

Em inventários em uma ún

equipamentos especiais oerros, o resultado final não será afetado. Em inventáriosm o de um mesmo indivíduo em ocasiões sucessivas, nnecessário medir sempre no mesmo local (altaonde é possível e marcar (com tinta) ee as mudanças ocorridas entre duas

Como é a pronúncia coD-A-P ou Dape ou Dapi? Segundo o Manual de Estilos da Abril, temos os seguintesconceitos:

 Sigla é a reunião das iniciais de um nome próprio composto de várias palavras e deve

ir, quase sempre, em caixa alta: CNBB, CPI, CPMF, IBGE, BNDS, CBF etc. Certas siglassilabáveis, mesmo estrangeira, são escritas em caixa alta e baixa: Vasp, Ibope, Inpa, Incra,Aids etc.

Diante disso, o nosso diâmetro à altura do peito tem que ser pronunciado como Dapeou Dapi. Certos estão os biólogos, ecólogos e outros não florestais e errados estão osengenh nta d de seção àqueles que pronunciam

nem ) àqueles que falam Dape ouapi p s, mas continuem pronunciando D-A-P., que é uma tradição

floresta

eiros florestais. Por co isso, quero dicar estaem (e tripudiemerrado esta variável, D-A-P. Não critiqu

D orque eles estão certol de mais de 40 anos no Brasil.

 Acrônimo é a reunião de elementos (iniciais, primeiras letras e sílabas) dos

mpoco nentes de um nome, com a intenção de formar uma palavra silabável e, deve ir, sempre,em caixa alta e baixa: Ibama, Cacex, Varig etc. Chichuá é um acrônimo.

14.1.2 DAP usado na estrutura da floresta

A curva do tipo J-invertido é a que melhor descreve a estrutura diamétrica dasflorestas da região amazônica. Os valores observados de DAP podem ser ajustados por funções matemáticas que produzem curvas que se assemelham ao tipo J-invertido. A mais

 popular na Amazônia é a função de Weibull. No anexo 4 está disponível uma revisão sobre asfunções Weibull e exponencial.

3 Machado, S.A. e Figueiredo Filho, A. 2003. Dendrometria. 309p.4 Campos, J.C.C. e Leite, H.G. 2002. Mensuração florestal. UFV. 407p.

Page 104: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 104/141

 

Como o DAP é a principal variável independente para o setor florestal da Amazônia,uma função de distribuição bem ajustada pode facilitar o inventário florestal sem perder a

 precisão. Com uma boa função, que apresenta a distribuição de probabilidade de cada classede DAP, o inventário usando a contagem de indivíduos por unidade de área é perfeitamente

  possível. Dessa forma, o tempo de coleta seria muito mais rápido e, conseqüentemente, o

me e DAP e ou H e biomassa e DAP e ou HT:

1) 

inventário ficaria mais barato.

14.1.3 DAP como variável independente de equações de volume e de biomassa

Tanto para volume e biomassa os seguintes modelos logarítmicos podem ser utilizados para descrever a relação entre volu

( ) DAPbaV  lnln += ou  ( ) DAPbaPF  lnln +=  

2)  ( ) ( ) H c DAPbaV  lnlnln ++= ou ( ) ( ) HT c DAPbaPF  lnlnln ++=  

onde: V = volume do tronco em m3

D = DAP em cmH = altura comercial ou comprimento do tronco em m

PF = peso fresco da parte aérea em kg

HT = altura total da árvore em m

natural

Todo o desenvolvimento desses modelos será detalhado na próxima seção. Aqui,querem

ln = logaritmo

os apenas mostrar os indicadores usados na escolha do melhor modelo, como erro padrão da estimativa syx, coeficiente de correlação (r) e coeficiente de determinação (r2), paraadvogar em favor do uso do DAP apenas. Vamos considerar modelo 1 como aquele que tem

apenas o DAP como variável independente e modelo 2 o que tem DAP e altura (comercial outotal), separadamente para volume e biomassa.

Volume (n = 959):

Modelo 1: syx

Modelo 2: syx = 1,04% r = 0,988 r 

= 1,46% r = 0,971 r 2 = 0,9432 = 0,977

Biomassa (n = 498):

Modelo 1: syx = 6,54% r = 0,984 r 2 = 0,967

Modelo 2: syx = 5,32% r = 0,989 r 2 = 0,978

Você vê alguma diferença entre os modelos 1 e 2, para volume e biomassa? Nestecapítulo queremos enfatizar apenas essas diferenças, sem se preocupar com o significado decada indicador (será explicado na próxima seção). No caso do volume, acrescentar a variávelH significa um ganho muito pequeno na precisão. O mesmo acontece com a biomassa.

Entretanto, acrescentar a altura (H ou HT) ao modelo é uma outra coisa. Em umhectare de floresta amazônica primária podemos ter: (i) 600-700 indivíduos arbóreos com

idindo o espaço com lianas, epífitas e palmeiras; (ii) alta diversidade emuitetura de copa de múltiplas formas; (iv) dossel com vários estratos em

(comprimentos) com trena. Durante o inventário florestal, a situação é outra, ou seja, temos

DAP≥ 10 cm divespécies; (iii) arqaltura; (v) espécies com idades diferentes, que podem variar de 1 a 100 anos.

Como medir a altura desses indivíduos? Para o desenvolvimento dos modelos, ométodo destrutivo é empregado; portanto, temos as árvores no chão e medimos as alturas

Page 105: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 105/141

 

que medir as alturas da árvore em pé. Mesmo com equipamentos sofisticados, é muito difícil,senão impossível, medir precisamente a altura total. A altura comercial pode até ser medida

com equipamentos, mas diferentes medidores podem apresentar diferentesa mesma árvore por causa da subjetividade em definir o que é "altura

merc

14.2. Á 

aneira:

 precisamentemedidas paraco ial". Nunca, mas nunca mesmo, "chutar" a altura para utilizar o modelo 2.

  Nos exemplos com equações de volume e de biomassa, temos o seguinte: (i)acrescentar a altura comercial (H) ao modelo 1, significa melhorar a precisão em 0,42% (1,46

 – 1,04) e (ii) acrescentar altura total (HT) ao modelo, significa melhorar a precisão em 1,22%(6,54 – 5,32). Vale a pena acrescentar a altura? Pense nisso, sobretudo, nos custos de coleta dedados para o inventário florestal.

rea basal 

É a projeção dos DAPs ao solo, que indica a densidade da floresta. Do ponto de vistatécnico, é a soma da área transversal de todos os indivíduos em um hectare. Área transversal éa área do círculo à altura do DAP. Isto é conseguido fazendo (imaginário) um corte

transversal no DAP e medindo o raio ou o diâmetro do círculo. É a área de um plano sobre otronco, disposto em ângulo reto ao eixo longitudinal. Portanto, a área transversal(classicamente representada pela letra "g") é obtida da seguinte m

( ) 42 DAPg i π =  

e a área basal, então:

( )∑ == nig AB i ,...2,1  

 Na área experimental de manejo florestal da ZF-2, a área basal média está em torno de30 m2/

iva de área basal, de forma isolada, diz muito pouco sobreuma determinada floresta. Com esses poucos exemplos, é difícil afirmar que a floresta da ZF-2, por exemplo, é muito densa ou pouco ou médio, porque deve haver florestas mais densas

nventariada já

s anos 90), era comum ver inventários florestais comolume

forma utilizado era igual a 0,7 proposto por peritos da FAO (Food and Agriculture

 No setor florestal, as decisões são tomadas baseadas no volume de madeira. Isto é tão

forte que, muitas vezes, o engenheiro florestal até se esquece que numa floresta há muitasoutras coisas além da madeira. Aqui, o objetivo é mostrar como se estima o volume de

ha. Isso quer dizer que se projetarmos todos os DAPs ≥ 10 cm sobre uma área de

10.000 m2

(um hectare), as árvores ocuparão 30 m2

. Algumas estimativas (m2

/ha) paradiferentes sítios na Amazônia: UHE de Santa Izabel (região do Araguaia) = 15,2; Projeto RioArinos (norte de MT) = 1,6; Floresta Estadual do Antimary (Acre) = 15,2, Trombetas (Pará) =24,8; PIC Altamira (Pará) = 22, Sul de Roraima = 20,9 e Alto Solimões (Fonte Boa e Jutaí noAM) = 27 m2/ha.

Com esses poucos exemplos, podemos dizer que a floresta da ZF-2 é mais densa doque as outras florestas. A estimat

do que esta. De qualquer modo, não custa nada estimar a área basal da área i

que as medições de DAP são obrigatórias em inventários florestais.Antigamente (até início do

v s estimados a partir da área basal, ou seja, AB x altura x fator de forma. O fator de

Organization) que realizaram os primeiros inventários na Amazônia nas décadas de 50 e 60. Aaltura era, invariavelmente, "chutada". O engenheiro florestal deve utilizar-se de equações

 próprias para estimar o volume de madeira.

14.3. Volume

Page 106: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 106/141

 

madeir precisa ter equações confiáveis e usá-las para es

strutivo. Antes de derrubar a árvore, o DAP émedido

(2002).

metria

a nos inventários florestais. Para isto, vocêtimar o volume de árvores em pé medidas em parcelas fixas do inventário florestal.

Volume real 

Para desenvolver equações de volume, você precisa ter o volume real de vários

indivíduos. Este volume pode ser obtido por meio do método destrutivo (aproveitando áreasexploradas ou desmatadas, autorizadas pelo Ibama) ou utilizando o relascópio de Bitterlich(por exemplo). O mais comum é o método de

. Com a árvore no chão, as alturas ou comprimentos (comercial e total) sãodeterminados e o tronco é dividido em pequenas toras, tentando se aproximar à forma docilindro.

Em geral, o tronco é dividido em 10 toras (ou seções) e duas medidas são tomadas emcada tora, na base e no topo. Com estas duas medidas, você tem condições de calcular as áreastransversais da base e do topo; aí, você estima a média (g da base + g do topo dividido por 2)e multiplica pelo comprimento da tora [lembrando que m2 de g vezes m do comprimento,você terá m3] para ter o volume da tora ou seção. A soma dos volumes das 10 toras éconsiderada "volume real" da árvore. Melhores explicações você vai encontrar nos livros deMachado & Figueiredo Filho (2003) e Campos & Leite

Quantas árvores são necessárias para desenvolver os modelos estatísticos paravolume ou equações de volume ou modelos alométricos?

Alo => (do grego: allos é outra e metron é medida) => é o estudo das variaçõesdas for tem dois significados: (i) o crescimento de uma

ma amostra representativa

mas e dos processos dos organismos e parte do organismo em relação ao crescimento do organismo inteiro ou de parte dele e (ii) oestudo das conseqüências do tamanho sobre as formas e os processos.

Você pode usar uma função conhecida de distribuição em diâmetro (Weibull, por 

exemplo) e ver se os dados já coletados se ajustam a esta função. Teste simples como o qui-quadrado (confrontação entre freqüência esperada e freqüência observada) dá conta disso. Seo teste for significante, colete mais dados das classes que estão faltando e refaça o teste qui-quadrado. Se o resultado for não significante, você tem, em mãos, ude sua população de interesse. Há também a possibilidade de utilizar-se do recurso doinventário florestal quanto à intensidade de amostragem; neste caso, cada indivíduo é umaamostra. A fórmula é a seguinte:

( ) 222 ε st n =  

sendo: t = valor obtido na tabela-t ( p2

= 0,05 ou outro e n-1 graus de liberdade)

2 al, o LE (limite de erro) é igual a

Observ

s = estimativa da variância2ε = expectativa do erro = (LE x média) . Em ger 

0,10 ou 10%.

ações: use z em vez de t. Como vimos anteriormente, os valores de z para os níveiscríticos , α = 0,05 e α = 0,01 são, respectivamente, 1,64, 1,96 e2,57. O ara populações finitas, ou seja, neste casoao denom 1 – n/N ). A população é consideradafinita q gundo Freese (1962)5.

mais freqüentes, α = 0,10utra coisa: há também o fator de correção p

inador da fórmula (ε2) deve ser acrescentado (uando a fração n/N é menor do que 0,05, se

 5 Freese, F. 1962. Elementary forest sampling. Agriculture Handbook nº 232. USDA-Forest Service.91p.

Page 107: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 107/141

 

 Equações de volume ou modelo alométrico

O os 70), ogrande desafio era encontrar o melho descrever a função V = f (DAP, H).Depois de várias dissertações e artigos ficou-se que qualquer modelo, seja desimples entrada (apenas DAP como v ente) ou de dupla entrada (DAP e Homo v

que apresenta r > 0,90, r 2 > 0,90 e syx (%) < 10. Além disso, o modelo tem que ter a b

tama

  passo seguinte é testar modelos matemáticos. Antigamente (fim dos anr modelo paracientíficos, veri

ariável independc ariáveis independentes, combinadas ou não) produzem bons ajustes. A decisão paraescolher o melhor modelo ficou nos detalhes.

Hoje em dia, qualquer modelo que você venha a testar, utilizando DAP e H, você vaiconseguir uma alta e significativa correlação, um modelo que explica mais de 75% davariação de seus dados (r2) e um erro padrão de estimativa aceitável. O padrão de hoje é omodeloum oa distribuição de resíduos, que é: as diferenças entre os valores estimados eobservados, positivos e negativos, têm que se distribuir uniformemente ao longo da curva (oureta) estimada, ou seja, estas diferenças não podem aumentar (ou diminuir) conforme aumentao nho da árvore. Por exemplo: se o seu modelo produzir uma diferença de 0,5 m3 para

uma árvore com DAP = 10 cm, esta mesma diferença (mais ou menos) tem que ser verificada para outra árvore com DAP = 70 cm ou DAP = 150 m.

Os modelos que apresentam as melhores distribuições de resíduos são os modeloslogarítmicos. Os mais usados são os seguintes, do item 1.1.3:

1) ( ) DAPbaV  lnln +=  

2) ( ) ( ) H c DAPbaV  lnlnln ++=  

A abordagem para estimar os coeficientes de regressão é a do método dos mínimos

es de derivar a equação em relação a a e b, primeiro é preciso linearizar as

∑ X2 = ∑ X2 Y

quadráticos (MMQ) e depois da obtenção das equações normais, os coeficientes podem ser estimados usando o método da substituição ou por meio do cálculo matricial. As explicaçõessobre as operações necessárias para se chegar aos coeficientes podem ser encontradas emqualquer livro de estatística básica. No computador, basta entrar com as variáveis ln V, ln D eln H e você terá, além dos coeficientes de regressão, erro padrão de estimativa, coeficiente decorrelação, coeficiente de determinação e distribuição de resíduos.

Regressão => descreve apenas o relacionamento linear entre uma variável dependente(Y) e uma ou mais variáveis independentes (X1 = DAP, X2 = altura etc.).

Antvariáveis aleatórias, da seguinte maneira: ln V = Y, ln D = X1 e ln H = X2. Para o modelo 1, asequações normais são:

a n + b ∑ X1 = ∑ Ya ∑ X1 + b ∑ X1

2 = ∑ X1Y

Pelo método de substituição, os coeficientes serão:

a = [ ∑ Y - b ∑ X1 ] / n

 b = [ SPC ] / [ SQC ]X1Y X1

Para o modelo 2, as equações normais são

a n + b ∑ X1 + c ∑ X2 = ∑ Y

a ∑ X1 + b ∑ X12 + c ∑ X1 X2 = ∑ X1 Y

a ∑ X2 + b ∑ X1 X2 + b 2

 

Page 108: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 108/141

 

Neste caso, é melhor estimar os coeficientes apelando para o cálculo matricial.

matriz de Y (nx1) = matriz de X (nxp) x matriz de coeficientes "b" (px1)

(X ) b = X'Y'X-1

ressão.

te de correlação =>  r  => a regressão descreve o relacionamento e este

% é consideradaaceitáv

que , ou seja,

   No caso deequaçõ emporais. Portanto, não

 precisa se preocupar com isto. Estes dois testes são usados para verificar se os termos doserros no modelo de regressão não são correlacionados e nem dependentes. Os termos dos

erros correlacionados com o passar do tempo são conhecidos como "autocorrelacionados" ou"serialmente correlacionados".

 b = (X'X) X'Y

Hoje, com o Excel ficou fácil inverter matrizes de qualquer tamanho e a multiplicaçãoé mais fácil ainda. Mesmo assim, não há necessidade de trabalhar com matrizes para aobtenção dos coeficientes. Os programas de estatística, em geral, calculam automaticamenteos coeficientes. Sei que para regressões simples (com dois coeficientes), o Excel dá conta dorecado. Para regressões múltiplas e as não lineares, é melhor usar outro software (Systat, SASetc.).

Vamos aproveitar as saídas (outputs) do Systat, por exemplo, para explicar ossignificados de alguns indicadores da reg

  1) Coeficien

coeficiente mostra o grau de estreiteza que existe entre as variáveis Y e X1, X2 etc.. Estecoeficiente varia de -1 a +1. Igual a -1 ou +1, há uma correlação perfeita, ou seja, a cadaunidade acrescentada à X, haverá um aumento proporcional em Y (uma, duas, ou menos 2unidades). Sinal (-) significa que os menores valores de Y tendem aos maiores valores de Xou vice-versa. Sinal (+) significa que os menores Y tendem aos menores X e os maiores Ytendem aos maiores X. O teste-t é geralmente utilizado para testar a significância de r.

2) Coeficiente de determinação => r2 => multiplicado por 100 mostra a percentagemda variação dos dados que é explicada pelo modelo testado. No caso de regressão múltipla,

 prefira sempre o coeficiente ajustado.

3) Erro padrão de estimativa => syx => é a raiz quadrada da média quadrática dos

resíduos (MQR), logo é o desvio padrão da relação. Ao comparar duas equações, o uso desteindicador é direto, ou seja, aquela que apresentar o menor erro é a melhor. Isoladamente, é preciso ainda alguns cálculos. Dividindo syx pela raiz quadrada de n você terá o erro padrão da

édia e dividindo o mm esmo pela média da variável dependente Y, você terá o seu erro em  percentagem. Melhor ainda é apresentar a incerteza de seu modelo. Neste caso, você temestimar o intervalo de confiança (IC) e aquela porção (z * erro padrão) dividida pela médiavai te fornecer a incerteza de seu modelo. Em geral, uma incerteza de 10

el.

4) Coeficientes de regressão => O Systat apresenta a constante ( a ) e os coeficientesassociados às outras variáveis independentes (b, c, d etc.) => o Systat apresenta também a

significância de cada coeficiente; se for não significante, você deve removê-lo do modelo.5) Análise de variância (ANOVA) => a regressão descreve, a correlação mostra a

estreiteza entre as variáveis e a ANOVA mostra a significância do seu modelo de regressão. Oteste-F é o que determina se o modelo é significante ou não. No Systat, o valor p é o mesmo

α  é o valor crítico para a tomada de decisão. Os valores clássicos de p são 0,01,0,05 e 0,10; portanto quando o p < 0,01, o modelo testado é significante para os três níveis.

6) Durbin-Watson D Statistics e First Order Autocorrelation =>es de volume (e biomassa), não há envolvimento de séries t

 

Page 109: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 109/141

 

  7) Distribuição de resíduos => o gráfico pode ser interpretado diferentemente por diferentes eng florestais, mas ele é fundamental para a decisão final do melhor modelo – conforme foi explicado anteriormente.

 Aplicação da equação de volume

Com o melhor modeloinventário na Amazônia, para áem mãos, você vai aplicá-lo em inventários florestais. Numrvores com DAP ≥ 10 cm, você deve utilizar uma parcela de,o mín 5 m). Numa parcela deste tamanho, você deve

re-se que, de acordo com o conceito de intervalo0,05, por exemplo) a sua estimativa estará dentro

surpreenda e confie natatíst

e avaliar o potencial de uma floresta para produção de energia. No manejoflorestal sustentável na Amazônia, a biomassa é usada para estimar a quantidade de nutrientesque é exportada do sistema via exploração de madeira e que é devolvida via inputsatmosféricos. No entanto, depois da Rio-92, a biomassa ganhou uma nova dimensão. Ocarbono da vegetação passou a ser um elemento importante nas mudanças climáticas globais.O eng florestal sabe (ou deveria saber) que aproximadamente 50% da madeira secada (emestufa) é carbono e que os compostos de carbono são: celulose (45%), hemicelulose (28%) elignina (25%).

De acordo com o IPCC (Painel Intergovernamental de Mudanças Climáticas), os

componentes de biomassa e carbono da vegetação são: (i) biomassa ou C na matéria vivaacima do nível do solo (tronco, galhos, folhas, frutos e flores); (ii) biomassa ou C na matériaviva abaixo do nível do solo (raízes) e (iii) biomassa ou C na matéria morta em pé ou no chão.

Quem foi treinado para estimar o volume de madeira tem todas as condições paraestimar a biomassa também. O anexo 5 é um artigo (manuscrito) sobre biomassa que já foi

 publicado na Acta Amazonica6. Este artigo cobre o componente 1 do IPCC.

O componente 2 envolve raízes e isto está sendo realizado pelo LMF (laboratório demanejo florestal do INPA) e será incluído em uma tese de doutorado. O trabalho de campo

 para obtenção do peso de raízes é muito trabalhoso, mas nada que assuste o verdadeiro engflorestal. Como o solo da Amazônia é muito pobre em nutrientes, as árvores tendem adesenvolver raízes superficiais – raramente ultrapassam 50 cm de profundidade. Mesmo naAmazônia, em regiões que têm as estações do ano (chuvosa e seca) bem definidas, as árvorestendem a desenvolver raízes mais profundas para procurar água, o que não é o caso daAmazônia Central.

O componente 3 pode ser estimado com precisão combinando as taxas de mortalidadecom os modelos usados no componente 1.

Coleta de dados => verdade de campo => método destrutivo

n imo, 2.500 m2 (10 x 250 m ou 20 x 12encontrar entre 100 e 150 indivíduos. Lembde confiança (IC), em 95 vezes (se o seu p =do seu IC e em 5 vezes, a estimativa estará fora do IC. Portanto, não sees ica (na incerteza que o seu modelo declarou). Não esquecer que os seus modelos sãologarítmicos e, por esta razão, ao estimar o volume de madeira você tem que usar o inverso dologaritmo natural que é a exponencial.

14.4. Biomassa

Estimar a biomassa é importante para compreender a produção primária de umecossistema

6 Higuchi, N., Santos, J. dos, Ribeiro, R.J., Minette, L. e Biot, Y. 1998. Biomassa da parte aérea davegetação da floresta tropical úmida de terra-firme da Amazônia brasileira. Acta Amazonica,28(2):152-166.

Page 110: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 110/141

 

Os procedimentos para o com esentados no Anexo 2. Ao incluir ocompon separar  as raízes ões dos

de água e carbono é a mesma utilizada na parte aérea. Aqui também,ção do que inspiração.

sa, cabem ainda as seguintes considerações: (i) você estima o peso fr 

  ponentes definidos pelo IP

 ponente 1 são apr ente 2 em coletas de biomassa, é preciso incluir as raízes. É preciso escavar,do tronco e pesá-las. A metodologia de coleta de amostras para as determinaç

teores (concentrações)exige-se mais transpira

   Equações de biomassa

Procedimentos iguais aos de volume.

 Aplicação da equação de biomassa

O parágrafo apresentado para o volume deve ser repetido aqui.

Para o caso de biomasesco; portanto, você tem que transformá-lo em peso seco e depois em carbono – basta

multiplicar o peso pelas concentrações de água e carbono obtidas em laboratório; (ii) ocarbono como commodity (mercadoria) em bolsas de mercadorias significa estoque ediferença de estoque; portanto, você precisa trabalhar com inventário florestal contínuo com,

 pelo menos, duas ocasiões; (iii) você precisa separar o peso nos três comCC.

Page 111: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 111/141

 

Capítulo 15iâmetro: Weibull versus Exponencial

ção:

er medida, com precisão, o diâmetro passa a ser aa para estimar o volume e a biomassa de florestasnia. Além disso, o diâmetro consagrou-se como uma

 portan tura florestal, como também na comercialização dees de diâmetro é fundamental para o

entend

uchi (1987) apresentam revisõesompre

A introdução da função de distribuição Weibull aos problemas relacionados comsilvicultura e manejo florestal, é atribuída à Bailey e Dell em 1973 (Zarnoch et al., 1982;

lutter et al., 1983 e Zarnoch e Dell, 1985). Desde então, esta distribuição temmente utilizada para descrever a distribuição de diâmetro, tanto em

 povoam especialmente nos Estados Unidos.

as segundo Barros et al. (1979) e Hosokawa (1981), a distribuiçãomais popular é

ro:a metodologia proposta por 

Zarnoch e Dell (1985), Cohen (1965) e Einsensmith (1985), respectivamente técnica dos  percentis, da máxima verossimilhança e exponencial, para a obtenção estimadores(coeficientes) das funções.

(i) Weibull – Máxima Verossimilhança (WMV)

A distribuição Weibull, que tem a seguinte função de densidade probabilística:

Distribuição de d

15.1. Introdu

Como a altura da árvore é difícil de svariável mais importante e mais segur tropicais de uma região como a Amazôvariável im escrição da estrute na dmadeira. Assim, a quantificação de distribuiçõ

imento da estrutura da floresta e do estoque da floresta, que são pré-requisitos nasdecisões do manejo florestal.

Bailey and Dell (1973), Clutter et al. (1983) e Higc ensivas sobre distribuições de diâmetro. De acordo com Clutter et al. (1983) eLawrence e Shier (1981), entre as várias distribuições estatísticas, a distribuição Weibull tem

sido a mais usada pelo setor florestal, depois da distribuição exponencial.

Little, 1983; Csido extensiva

entos equianos como multianos,

  No Brasil, especialmente na floresta amazônica, a Weibull foi utilizada por Higuchi(1987), Umaña (1998), m

a exponencial.

15.2. As funções de distribuição de diâmet Nesta comparação entre Weibull e exponencial, usaremos

( ) ( ) ( ) )b x xbc x f cc /exp1 −= −

; para x≥0, c>0 e b>0

mos

c/b) + Σ (c-1) ln xi – (1/b) Σ xic

or meio da diferenciação em relação a c e b e igualando a zero as derivadas, asseguintes equações serão obtidas:

= 0, em outras circunstânciastem a seguinte função de verossimilhança para uma amostragem de n observações

L (x , ....., x ; c, b) = n (c/b) x c-1 exp (-xic/b) (1)i n i

Tirando o logaritmo de (1), tere

ln L = Σ ln [(c/b)xic-1 exp (-xi

c/b)]

ln L = Σ [ln (c/b) + ln xic-1 – (xi

c/b)]

ln L = n ln (

P

 

Page 112: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 112/141

 

d ln L/d c = n/c + Σ ln xi – (1/b) Σ xic ln xi = 0 (2)

Tirando b de (3), temos

/c) – (Σ xic ln xi) / Σ xi

c] = - Σ ln xi 

Σ ic] – 

, eio de qualquer processouação (5). O coeficiente b 

inada através da seguinte função de distribuiçãoue, por sua vez, pode ser encontrada integrando a sua função de

ensidade probabilística, f(x), do DAP mínimo até o máximo (Zarnoch et al., 1982)

d ln L/d b = -(n/b) + (1/b2) Σ xic = 0 (3)

 b = (Σ xic ) / n (4)

e substituindo em (2), temos

n/c + Σ ln xi – [1/(Σxic/n)] Σxi

c ln xi = 0

n [(1

[(Σ xic ln xi) / x (1/c) = (1/n) Σ ln xi (5)

Dessa forma o coeficiente c pode ser estimado por miterativo ou via tentativa-e-erro para igualar os dois lados da eq

 pode ser estimado pela equação (4), depois de estimado o c.

A freqüência esperada pode ser determcumulativa de Weibul, F(x), qd

( ) ( ) ]cba x xF  −−−= exp1  

ii. Weibull Percentis (PERC):

A função de Weibull usando o método dos percentis, tem a seguinte função dedensidade probabilística

f (x) = (c/b) [(x-a)/b)c-1

exp {-[(x-a)/b]c

; para x≥a≥0, b>0 e c>0f (x) = 0, em outras circunstâncias

Os parâmetros a, b e c são estimados da seguinte maneira:

( ) ( )21221 2 x x x x x xa nn −+−=  

( )n xab 63,0+−=  

( )[ ] ( )[ ]

( ) ( )a xa x

 p pc

npinpk 

ik 

−−

−−=

ln

1ln1lnln 

onde:

x i ( i = 1, 2, ... n) = é o i-ésimo DAP em ordem crescente

x 1 = é o menor DAP e x n = é o último DAP, ou seja, o maior DAP.

x (0,63n) = é o DAP rankeado em ( 0,63 * número total de DAP observados). Exemplo: numconjunto de dados de 100 DAPs, x (0,63n) é o 63° DAP.

 p i = 0,16731 e p k = 0,97366

A freqüência esperada pode ser determinada por meio da seguinte função de

distribuição cumulativa de Weibul, F(x), que, por sua vez, pode ser encontrada integrando a

Page 113: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 113/141

 

sua função de de1982).

nsidade probabilística, f(x), do DAP mínimo até o máximo (Zarnoch et al.,

( ) ( ) ]cba x xF  −−−= exp1  

(iii) Exponencial:

As estimativas dos parâmetros da primeira ordem da função exponencial

os c .

rada): caso Weibull percentis para DAP ≥ 10

P (x

c

P ( 3

etc …

bxaeY =  

  podem ser obtidos pela linearização (série de Taylor) ou por meio do método iterativo(Marquardt, por exemplo), segundo Draper e Smith (1981). O software Systat pode calcular 

oeficientes pelos dois métodos

3. Cálculo das probabilidades (freqüência espe

cm< 10) = 1 – {exp – [(10 – a)/b]c}

P ( 10 ≤ x < 20 ) = {exp – [(10 – a)/b]c} - {exp – [(20 – a)/b]c}cP ( 20 ≤ x < 30 ) = {exp – [(20 – a)/b] } - {exp – [(30 – a)/b] }

0 ≤ x < 40 ) = {exp – [(30 – a)/b]c} - {exp – [(40 – a)/b]c}

até o último intervalo.

Page 114: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 114/141

 

3. Bibliografia:

Bail ullFunctio

Barros, P.L.C., S.A. Machado, D. Burger e J.D.P. Siqueira. 1979. Comparação de Modelos

Descritivos da D (2):19-31.Clutter, J.L., J.C. Fortson, L.V . Bailey. 1983. Timber  

Management: A Quantitative Approach. John Wiley and Sons, Inc. New York. 333p.

Cohen, A.C. 1965. Maximum Likelihood Es in the Weibull Distribution Based onCo

. 1998. Distribuições Diamétricas da Floresta Tropical Úmidaonica 28(2):167-190.

Zarnoch, S.J.Estimators

S.J., C.W. Ramm, V.J. Rudolph e MW. Day. 1982. The effects of Red Pine

ey, R.L. e T.R. Dell. 1973. Quantifying Diameter Distributions with the Weibn. Forest Science 19:97-104.

istribuição Diamétrica em uma Floresta Tropical. Floresta 10. Pienaar, G.H Brister e R.L.

timationmplete and on Censored Samples. Technometrics 7(4):579-588.

Draper, N.R. e H. Smith. 1981. Applied Regression Analysis. John Wiley and Sons, Inc. NewYork. Segunda edição. 709p.

Einsesmith, S.P. 1985. PLOTIT: User’s Guide.

Higuchi, N. 1987. Short-term Growth of an Undisturbed Tropical Moist Forest in theBrazilian Amazon. Tese de Doutor, Michigan State University. 129p.

Hosokawa, R.T. 1981. Manejo de Florestas Tropicais Úmidas em Regime de RendimentoSustentado. UFPr, Relatório Técnico.

Lawrence, K.D. e D.R. Shier. 1981. A Comparison of Least Squares and Least AbsoluteDeviation Regression Models for Estimating Weibull Parameters. Commun. Statist. – Simula Computa. B10(3):315-326.

Little, S.N. 1983. Weibull Diameter Distribution for Mixed Stands of Western Confiers.Can.J.For.Res. 1:85-88.

Umana, C.L.A. e Alencar, J.Cem uma Área no Município de Itacoatiara – AM. Acta Amaz

e T.R. Dell. 1973. An Evaluation of Percentile and Maximum Likelihoodof Weibull Parameters.

Zarnoch,Thinning Regimes on Diameter Distribution Fitterd to Weibull Function. MSUAgricultural Experiment Station East Lansing. RI-423. 11p.

Page 115: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 115/141

 

Capítulo 16Bi

is logarítmicos - para estimar a biomassa deárvores

P<20 cm e

omassa da Parte Aérea da Vegetação da Floresta TropicalÚmida de Terra-Firme da Amazônia Brasileira.

 Niro Higuchi1 , Joaquim dos Santos1 , Ralfh João Ribeiro1,Luciano Minette1 e Yvan Biot2 

 Resumo 

Usando um banco de dados com 315 árvores, com DAP≥5 cm, foram testados quatromodelos estatísticos - linear, não linear e do

em pé. Os dados foram coletados, de forma destrutiva, na região de Manaus, Estadodo Amazonas, em um sítio coberto por floresta de terra-firme sobre platôs de latossoloamarelo. Em diferentes simulações com diferentes intensidades de amostragem, os quatromodelos estimam precisamente a biomassa, sendo que o afastamento entre a média observadae a estimada, em nenhuma ocasião ultrapassou 5%. As equações para estimar a biomassa deárvores individuais em uma parcela fixa, distintamente para árvores com 5≤DAcom DAP≥20 cm, são mais consistentes do que o uso de uma única equação para estimar,genericamente, todas as árvores com DAP≥5 cm. O modelo logarítmico com apenas umavariável independente, o DAP, apresenta resultados tão consistentes e precisos quanto osmodelos que se utilizam também da variável altura total da árvore. Além do modeloestatístico para estimar o peso da massa fresca total de uma árvore, outras informações sãoapresentadas, estratificadas nos diferentes compartimentos (tronco, galho grosso, galho fino,folhas e, eventualmente, flores e frutos) de uma árvore, como: concentração de água paraestimar o peso da massa seca, concentração carbono e a contribuição do peso de cada

compartimento no peso total. palavras-chaves: Carbono, manejo florestal, modelo estatístico.

  between observed and estimated biomass was

Aboveground Biomass of the Brazilian Amazon Rainforest

Abstract 

Data set with 315 trees with diameter at breast height (dbh) greater than 5 cm was used totest four statistical models - linear, non-linear and two logarithmics - to estimate aboveground

  biomass of standing trees. The data were collected destructively in Manaus region, CentralAmazonia, in a site covered by a typical dense “terra-firme” moist forest on plateausdominated by yellow latosols. The difference

always below 5%. The logarithmic model using a single independent variable (dbh) producedresults as consistent and precise as those with double-entry (dbh and total height). Besidesstatistical models to estimate aboveground biomass, the following information are also

 presented in this paper: the contribution of each tree compartment (stem, branch, twigs, leavesand flowers or fruits) to the total weight of a standing tree, water concentration to estimate thedry weight and carbon concentration of each tree compartment.

Key words: Carbon, forest management, statistical model

1 Instituto Nacional de Pesquisas da Amazônia - Cx. Postal, 478 - Manaus - Am.2 U. K. Overseas Development Administration (ODA). Victoria Street, 94 - London. SW1E5JL -England.

Page 116: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 116/141

 

 Introdução:

O objetivo deste trabalho é o desenvolvimento de modelos estatísticos para estimar a biomassa individual, de árvores em pé, de espécies da floresta densa de terra-firme, região deManaus (AM), assim como a apresentação de informações necessárias para a conversão demassa fresca para massa seca e de biomassa para estoque de carbono. São testados quatromodelos, linear, não-linear e dois logarítmicos, tendo como variável dependente, o peso da

assa

osfera durante um processo de queimadas.

stal está associado ao uso sustentável dos recursos florestais existentes,andas da sociedade, por produtos madeireiros e não-madeireiros.

“inputs” atmosféricos e, com isto,inimi

 

m fresca (não seca) e, como variáveis independentes, diâmetro à altura do peito (DAP) ealtura total, de árvores individuais. O principal atributo dos modelos testados é o tamanho daárvore e, por esta razão, têm que absorver a alta diversidade florística e as diferentesassociações botânicas, distribuições espaciais e densidades da madeira (intra einterespecíficas), da vegetação de terra-firme.

As estimativas de biomassa florestal são informações imprescindíveis nas questõesligadas, entre outras, às áreas de manejo florestal e de clima. No primeiro caso, a biomassaestá relacionada com os estoques de macro e micronutrientes da vegetação, que são obtidos

 pelo produto da massa pelas concentrações de cada mineral. No caso do clima, a biomassa é

usada para estimar os estoques de Carbono, que, por sua vez, são utilizados para estimar aquantidade de CO2 que é liberada à atm

O manejo flore  para atender às demTratando-se de Amazônia, os cuidados têm que ser redobrados porque estes recursos estão emecossistemas heterogêneos, complexos e frágeis. Os solos da Amazônia são antigos e, em suamaioria, pobres em nutrientes (especialmente para a agropecuária) e ácidos. A contrastanteexuberância de sua cobertura florestal está associada às estratégias de conservação e deciclagem de nutrientes dentro do próprio sistema. É importante conhecer a distribuição denutrientes nos diferentes compartimentos (tronco, galho, casca, folha), para controlar a

exportação dos mesmos pela colheita florestal e entrada viam zar os impactos ambientais da produção madeireira.

Para as questões climáticas, há grande interesse em quantificar a biomassa que éconvertida, principalmente em dióxido de carbono, pelas diferentes formas de uso do soloamazônico (Fearnside et al., 1993, Foster Brown et al., 1995, Higuchi & Carvalho Jr., 1994,Skole et al., 1994, Schroeder & Winjum, 1995 e Fearnside, 1996). Esta informação énecessária para uma correta avaliação da contribuição dos projetos de desenvolvimento daregião, no processo de mudanças climáticas globais, no âmbito da Convenção do Clima,assinada pelo Governo Brasileiro durante a Conferência das Nações Unidas sobreDesenvolvimento e Meio Ambiente, Rio-92.

As estimativas de biomassa, atualmente disponíveis na literatura, dos diversos tiposflorestais da Amazônia, vêm de estudos que se utilizam de métodos diretos e indiretos. Ométodo direto consiste na derrubada e pesagem de todas as árvores que ocorrem em parcelasfixas, fornecendo estimativas, que segundo Brown et al. (1989), não são confiáveis porque

 baseiam-se em poucas parcelas, pequenas e tendenciosamente escolhidas. No método indireto,as estimativas têm sido produzidas a partir de dados de inventários florestais, que foramexecutados com a finalidade de planejar a exploração e o manejo florestal, sendo o volume damadeira, a principal variável. Neste método, a biomassa é estimada a partir do volume damadeira, usando-se a densidade média da madeira e um fator de correção para árvores comDAP < 25 cm.

Estes dois métodos ainda geram muita polêmica e controvérsias e produzemestimativas desencontradas, mesmo quando se usa o mesmo banco de dados (Fearnside et al.,1993, Brown et al., 1989 e Higuchi et al., 1994 e Foster Brown et al., 1995). A tabela 1 ilustra

Page 117: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 117/141

 

o que foi posto anteriormente. Esta tabela foi parcialmente reproduzida de FEARNSIDE et al.(1993), considerando apenas a biomassa viva acima do nível do solo. São produzidasestimativas diferentes, com o passar do tempo, pelos mesmos autores e para o mesmo bancode dados (montado nos anos 70). Além disso, Foster Brown et al. (1995) criticam estes

 bancos

re, pelo método direto, ao

nia; um proposto por Sandra Brown e colaboradores e, outro,er Uhl e colaboradores. O primeiro requer o conhecimento da

ente

rimental de Silvicultura Tropical (EEST)te de Manaus, em áreas derrubadas para

dióxido de carbono, usando-se queimadas tradicionalmente praticadas por pequenos produtores da região, e em áreas especialmente designadas para esta pesquis escolhidas áreas de platôs sobre latossolo amarelo. Estes

e biomassa do INPA.

e pesadas 315 árvores-amostras com DAP≥5 cm. O pesostrados foi compartimentado em tronco e copa (incluindofrutos). Além do peso da árvore, foram também medidos o

altura total, altura comercial, altura da copa e diâmetro da copa. A distribuição de

de dados, afirmando que as alturas das árvores foram obtidas sem aparelhos de

medição e que, estes erros não amostrais não são mencionados.O consenso existente entre os pesquisadores que trabalham com biomassa é de que é

  praticamente impossível determinar a biomassa de cada árvoexecutar um inventário florestal. Por esta razão, os recursos da análise de regressão para odesenvolvimento de modelos estatísticos, para estimar a biomassa de árvores em pé, devemser empregados para superar este problema. Salomão et al. (1996) citam apenas dois modelosestatísticos utilizados na Amazô

  proposto por Christophdensidade da madeira de cada indivíduo, que é praticamente impossível obte-la durante oinventário; e o segundo, é recomendado para florestas secundárias. Além destes, há o modelo

de Overman et al. (1994), para a floresta amazônica colombiana, desenvolvido principalm para árvores de pequenos diâmetros.

 Materiais e Métodos

(i) Coleta de Dados: 

Os dados foram coletados na Estação Expedo INPA, aproximadamente 90 km ao nor experimentos com liberação de

a. Nos dois casos foramdados constituem o banco de dados d

No total, foram derrubadastotal de todos os indivíduos amogalhos e folhas e, eventualmente,DAP,freqüência e a estatística descritiva dos dados observados encontram-se nas tabelas 2a e 2b).

 Na tabela 2c observam-se as estatísticas descritivas para as variáveis DAP, altura total e pesototal, quando os dados são divididos em algumas classes de diâmetro. Nesta tabela ficaevidente que a variável peso total tem uma variabilidade natural bem maior que as outras duasvariáveis, mesmo em mais classes de diâmetro.

e nutrientes de cada compartimento daoram coletados diferentemente, baseando-se no

Jr. (1994) e Santos (1996). Foram retiradasmostras (discos) a 0% (base), 25, 50, 75 e 100% (topo) do tronco e do galho grossoiâme tronco foi retirado também um disco à altura do DAP. Todos

res foi compartimentado em tronco, casca,galho grosso, galho fino (diâmetro<10 cm), folha e, eventualmente, flores e frutos. Além

Para obtenção das concentrações de águaárvores, 38 indivíduos (dos 315 amostrados) f esquema apresentado por Higuchi & Carvalhoa(d tro de base≥10 cm). Doos discos retirados foram imediatamente pesados e enviados ao laboratório para secagem emestufas calibradas a 105o C. O mesmo procedimento foi adotado para os galhos finos e folhas,mas que em vez de discos, foram retiradas, de várias partes da copa, amostras de 5 e 3 kg,respectivamente. A estimativa da concentração de carbono na vegetação das espécies maisabundantes, no sítio estudado, foi feita tendo ainda as amostras coletadas por Higuchi &Carvalho Jr. (1994).

O peso total de cada uma destas 38 árvo

 

Page 118: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 118/141

 

destas concentrações, a coleta compartimentada permite ainda a determinação da contribuiçãode cada um dos compartimentos no peso total da árvore. A estatística descritiva destes dados ea contribuição de cada compartimento no peso total e a porcentagem do Peso da massa frescaque é transformado em Peso da massa seca, visualizam-se nas tabelas 3a e 3b.

Um desdobramento da pesquisa de Nutrientes é o estudo de densidade da madeira(g/cm3), nos sentidos base-topo e casca-medula da árvore (utilizando-se das amostrascoletadas a 0, 25, 50, 75 e 100% da altura comercial e do DAP). Resultados preliminares

rvores analisadas.

foi dividido em dois, para árvores com 5≤DAP<20 cm e DAP≥20m. Fo

et al., 1995,alomã

vas variações intra es, Overman et al. (1994) descartam esta variável, apesar 

.

deste estudo encontram-se na tabela 4, de 12 á

O banco de dados de biomassa do INPA vem sendo completado ao longo do tempo e já foi utilizado preliminarmente por Higuchi et al. (1994), Higuchi & Carvalho Jr. (1994),Araújo (1995) e Santos (1996).

(ii) Modelos Testados: 

Os modelos estatísticos foram selecionados a partir do trabalho de SANTOS (1996),que testou 34 diferentes modelos em diferentes combinações.

O banco de dadosc ram testados os seguintes modelos estatísticos, para todas as árvores com DAP≥5 cm,equação única, e para as duas classes de tamanho, (a) 5≤DAP<20 cm e (b) DAP≥20 cm:

1. ln Pi = β0 + β1 ln Di + ln εi 

2. ln Pi = β0 + β1 ln Di + β2 ln Hi + ln εi 

3. Pi = β0 + β1 Di2Hi + εi 

4. Pi = β0 D β1 H β2 + εi 

 para i = 1, 2, ... 315 - equação única

i = 1, 2, ... 244 - equação (a)

i = 1, 2, ... 71 - equação (b) 

onde:

Pi = peso da massa fresca de cada árvore, em quilograma (para modelos 1, 2 e 4) e emtoneladas métricas (para o modelo 3).

Di= diâmetro à altura do peito de cada árvore, DAP, em centímetros (para modelos 1,2 e 4) e em metros (para o modelo 3)

Hi = altura total de cada árvore, em metros

β0, β1 e β2 = coeficientes de regressão

εi = erro aleatório

ln = logarítimo natural

Os modelos estatísticos propostos por Brown e Lugo (Foster BrownS o et al., 1996) e aqueles que apresentaram os melhores resultados no trabalho deSaldarriaga et al. (1988), que incluem densidade da madeira, não foram testados porque estavariável é de difícil obtenção para cada indivíduo em pé. Além disso, segundo Higuchi &Carvalho Jr. (1994), a densidade da madeira (g/cm3) apresenta significatiinter-específicas. Pelas mesmas razõe

do bom desempenho dos modelos que a contém

 

Page 119: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 119/141

 

 Na tabela 4, onde visualizam-se as densidades de 12 árvores, observa-se que: a menor sentido base-topo;el é sempre menor P é igual a 0,803,

a vez, é diferente de todas as estimativas fornecidas por Foster Brown et al. (1995)

ldarriaga et al. (1988). As variações no sentido casca-medula também são

em pé daudo, foram adotados os procedimentos tradicionais da ciência florestal, que são:iente de determinação, menor erro padrão de estimativa e melhor distribuição dos

de diferentesda biomassa. Foramco de dados original;

0 amo n = 300.

e Discussão: 

es quantitativaso sítio s e para

m ca distribui-se da seguinteaneir 

inação e os erros padrões de estimativa deelos estatísticos testados (árvores com DAP≥5 cm), incluindo as

variaçõ

minação (r 2), exceto para o modelo 3. Com relação ao (sy.x), o

mpenho é do modelo 3, seguido do modelo 4.

, apresentaum claro padrão, aumentando os desvios conforme aumentam os DAP’s.

As equações resultantes são:Modelo 1: 

densidade é de 0,480 e a maior é de 1,031; a densidade tende a diminuir noa densidade média, considerando base-topo, é de 0,756; e esta última variávque a densidade média obtida na altura do DAP. A densidade média do DAque, por su

e a de Sasignificativas (Higuchi & Carvalho Jr., 1994).

(iii) Escolha do Melhor Modelo Estatístico: 

Para a escolha do melhor modelo estatístico visando-se estimar a biomassaárea em estmaior coeficresíduos (Santos, 1996). Além destes procedimentos, foram simuladas amostrasintensidades, para testar a consistência dos modelos na estimativatomadas 15 amostras com 50 árvores selecionadas aleatoriamente do ban1 stras com n = 100; 5 amostras com n = 200; e 5 amostras com

 Resultados

Do trabalho de Higuchi & Carvalho Jr. (1994), as seguintes informaçõd estudado são importantes para uma melhor interpretação destes resultadofuturas comparações com outros sítios:

- Em uma parcela fixa de 2.000 2, o peso da biomassa fresm a, em relação ao peso total: a vegetação (exceto cipós) com DAP≥5 cm contribui com86,9% do peso total; a vegetação com DAP<5 cm contribui com 2,4%; os cipós contribuemcom 1,3% e a liteira (toda a vegetação morta sobre a superfície do solo) contribui com 9,4%.

- Os teores médios de carbono são os seguintes: tronco (48%), galhos grossos (48%),

galhos finos (47%), folhas (39%), plântulas - até 50 cm de altura - (47%), mudas - altura>50cm e DAP<5 cm - (49%), cipós (48%) e liteira (39%).

Os coeficientes de regressão e de determtodos os quatro mod

es (a) para árvores com 5≤DAP<20 cm e (b) DAP≥20 cm, verificam-se na tabela 5. Deum modo geral, os quatro modelos (incluindo as variações a e b) estão aprovados nos quesitoscoeficiente de determinação (r 2) e erro padrão de estimativa (sy.x) e, por esta razão, poderiamser utilizados para estimar a biomassa de árvores em pé da área em estudo.

Todos os modelos apresentam coeficientes de correlação (r) altamente significantes(α<0,01). De um modo geral, os modelos únicos para árvores com DAP ≥ 5 cm apresentamos maiores coeficientes de deter modelo 4 é o que tem o melhor desempenho, apresentado os menores erros, seguido domodelo 2. Combinando as equações a e b, no mesmo banco de dados, os erros (emquilogramas) produzidos foram: 949, 693, 356 e 537, respectivamente para os modelos 1, 2, 3e 4. Nesta situação, o melhor dese

O exame da distribuição dos resíduos mostra que os modelos 1, 2 e 3 não apresentamnenhum padrão, distribuindo-se aleatoriamente ao longo do eixo da biomassa observada eestimada, ordenada de forma crescente pela variável DAP. O modelo 4, no entanto

 

Page 120: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 120/141

 

 

2,694 + 2,038 ln D + 0,902 ln H ; para DAP≥5 cm

Modelo

a consistência de cada um dos modelos estatísticos para estimar aassa em pé, sobre am

 

em um desvio médio de +2,8%, que

os de -1,9% (1,6 e 2,3, menor e maior 

stimar rvores com 5≤DAP<20 cm e DAP≥20 cm, separadamente.

- Equações a & b: (a) ln P = -1,754 + 2,665 ln D; para 5≤DAP<20 cm

(b) ln P = -0,151 + 2,170 ln D; para DAP≥20 cm

- Equação única: ln P = -1,497 + 2,548 ln D; para para DAP≥5 cm

Modelo2: 

- Equações a & b: (a) ln P = -2,668 + 2,081 ln D + 0,852 ln H ; para 5≤DAP<20

(b) ln P = -2,088 + 1,837 ln D + 0,939 ln H ; para DAP≥20 cm

- Equação única: ln P = -

3: 

- Equações a & b: (a) P = 0,0056 + 0,621 D2 H ; para 0,05≤DAP<0,20 m

(b) P = 0,393 + 0,473 D2 H ; para DAP≥0,20 m

- Equação única: P = 0,077 + 0,492 D2 H ; para DAP≥0,05 m

Modelo 4: 

- Equações a & b: (a) P = 0,0336 * D2,171*H 1,038; para 5≤DAP<20 cm

(b) P = 0,0009 * D1,585*H 2,651; para DAP≥20 cm

- Equação única: P = 0,001 * D1,579*H 2,621; para DAP≥5 cm

A verificação d biom ostras simuladas (tiradas aleatoriamente do banco de dadosoriginal), encontram-se na tabela 6. Nesta tabela verificam-se as médias observadas eestimadas em cada simulação. A análise é feita sobre o afastamento da média estimada em

relação à observada, em percentagem, utilizando-se equações distintas para estimar a biomassa de árvores com 5≤DAP<20 cm e DAP≥20 cm e uma única equação para todas asárvores contidas na amostra com DAP≥5 cm.

(i) Modelo 1: 

- Usando as equações a e b, para estimar a biomassa do banco de dados original, amédia estimada afasta-se -1,9% da média observada, ou seja, o desvio7 é de -1,9%. Quandoutiliza-se uma só equação para estimar a biomassa das duas classes de diâmetro, odesempenho anterior não é repetido, apresentando um desvio de +16%. Excepcionalmente, nasimulação com n = 50, o uso de uma só equação resulta

 poderia ser considerado bom se não fosse a amplitude de variação entre o menor e o maior 

desvio, que foi de 0,1 a 24,9%.- Este modelo (equações a e b) demonstra a mesma consistência nas simulações com n

= 300, n = 200 e n = 100, respectivamente, com desvidesvio, em valores absolutos), +0,5% (2,7 e 11,6) e +2,6% (3,7 e 22,1). A simulação com n =50, o desvio médio é de -10,2%.

- A equação única para estimar a biomassa, usando este modelo estatístico, não éalternativa para as duas equações, ou seja, o uso deste modelo requer as duas equações parae a biomassa de á 7 Desvio

sempre o menor e, o segundo, o maior desvio.

é afastamento, em %, do peso médio estimado pelas diferentes equações, em relação ao

peso médio observado. Entre parêntesis, os desvios aparecem em valores absolutos e o primeiro é

Page 121: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 121/141

 

- Trata-se de um modelo com apenas o DAP como variável independente, que é umavariável fácil de ser medida no campo, sem erros não amostrais. O único problema destemodelo

do que o

% (5,2 e 6,7) e -1,1% (0,9 e 12,7). A simulação com n = –9,4%. O uso de uma só equação tem um desempenho razoável para

a.

rio do modelo 1.

(iii) Modelo 3

- Usando as e de dados original, amédia estimada afasta-se +1,2% da média observada. Quando se utiliza uma só equação paraestimar a biomassa das elhor do que oanterior, com desvio e u lar o dos resíduos, estemodelo tem uma boa o o banco de dados,

as equações

00, n = 100 e n = 50, respectivamente, com desvios de +1,2% (0,4 e 1,6, menor eaior desvio, em

nativa para estimar a biomassa,

s classes de diâmetro. Para grandes inventários

é que o peso será sempre o mesmo, para um determinado diâmetro,independentemente da altura da árvore, da espécie e de outros atributos da árvore.

(ii) Modelo 2: 

- Usando as equações a e b, para estimar a biomassa do banco de dados original, amédia estimada afasta-se -3,6% da média observada. Quando utiliza-se uma só equação paraestimar a biomassa das duas classes de diâmetro, o seu desempenho é melhor anterior, com desvio de +2,9%.

- Este modelo (equações a e b) demonstra a mesma consistência nas simulações com n= 300, n = 200 e n = 100, respectivamente, com desvios de -3,6% (3,2 e 4,3, menor e maior desvio, em valores absolutos), -1,850, o desvio médio é detodas as simulações, que exceto para n = 50, apresenta desvio menor do que quando seutilizam as equações a e b.

- Apesar do bom desempenho da equação única, em relação aos desvios médios, ondeas diferenças são negligíveis, as amplitudes de variação dos mesmos nas equações a e b sãomenores, sendo, por esta razão, mais apropriadas para a estimativa da biomass

- A incorporação da altura total neste modelo permite estimar diferentes pesos paraiguais DAP’s, ao contrá

quações a e b, para estimar a biomassa do banco

duas classes de diâmetro, o seu desempenho é mde +0,1%. Apesar d m c o padrão na distribuiçãcapacidade de compensação quando se utiliza tod

tanto com a e b como com a equação única para as duas classes de diâmetro.

- Este modelo (equações a e b) demonstra a mesma consistência nas simulações com n= 300, n = 2m valores absolutos), +3,1% (1,1 e 1,7), +3,8% (0,8 e 20,3) e -4,8% (0,4 e19,4). O uso de uma só equação tem um desempenho tão consistente quanto ao anterior, comdesvios de +0,1% (0,2 e 0,9), +2,2% (0,6 e 11,5), +2,4% (0,7 e 17,6) e -6,8% (0,4 e 16,2),respectivamente para n = 300, n = 200, n = 100 e n = 50.

- A equação única para este modelo é a melhor alter  principalmente considerando apenas a estimativa da biomassa média de uma parcela fixa, sem  preocupar-se com as estimativas individuais. Em todos os tamanhos da amostragem, estaequação demonstrou-se bastante consistente e precisa.

- Sem preocupar-se com as estimativas individuais, prestando atenção apenas no totalou na média das parcelas fixas, este é o melhor modelo entre os testados. De um modo geral,este modelo superestima o peso das menore

 para estimativa de biomassa, este modelo é o mais preciso.

(iv) Modelo 4: 

- Usando as equações a e b, para estimar a biomassa do banco de dados original, a

média estimada afasta-se -4,6% da média observada. Quando utiliza-se uma só equação para

Page 122: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 122/141

 

estimar a biomassa das duas classes de diâmetro, o desempenho anterior não é repetido, comesvio de -7,3%.

çõe on c n= vamente, com de r e

maior desvio, em s absolu e 3,7), -4,0% (1,2 e 7,6) e -7,7% (4,2 e 16,1).O uso ação tem enho i r a to os e,

uas equações. Neste casa á ≤DAP<20 cm e

odelos te mod o qu udesde variação, demonstrando uma boa consistência na estim a biomassa. É um modelo

  basta e que oucas esas dasdiferentes classes de diâmetro.

Considerações finais: 

m estimativas confiáveis de

iomassa de árvore em pé, todos com desvios inferiores a 5% em relação à média.20 cm e com DAP≥20 cm são

AP≥5 cm.

odel dos, o elhores são os modelos 1 e 4, respectivamente comas s:

(a) ln P = -1,754 + 2,665 ln D; para 5≤DAP<20 cm

(b) ln P = -0,151 + 2,170 ln D; para DAP≥20 cm

e

(a)  P = 0336 *   1,038; para 5≤DAP<20 cm(b) P ,0009 *  5*H 2,651; para DAP≥20 cm

O modelo 1 tem a vantagem de ser dependente de apenas uma variável, oDAP, que é uma variável f l de se ida no campo, com poucos riscos de erros nãoamost

odelo 4 tem a vantagem de ser muito consistente e de poder estimar maisrealistica árvores ind is, com smos DAP’s e diferentes alturas. Além disso, este

odelo já foi preliminarmente utilizado por Araújo (1995), em Tomé-Açu (Pará), paraonfrontar com os resultados obtidos pelo método direto. Em Tomé-Açu, a biomassa estimada

 bservada.4. A eficiência das equações está associada à utilização de parcelas fixas para o

inv biomassa de um dete sítio, dimen imas adasntários fl s na Ama .

  peso do seco co onde a 61% seu peso s da secag o dade a 5 seu pes

 peso to uma ár ,6% é tronco e 34,4% é copa. A contribuição detimento da árvore em seu peso total é a seguinte: tronco (65,6%), galho grosso

alho fino (1 ), folhas (2,03%) e flores/f s (0,01%).

7. Os teores médios de carbono são os seguintes: tronco (48%), galhos grossos (48%),alhos finos (47%) e folhas (39%).

d

- Este modelo (equa= 300, n = 200, n = 100 e n

s a em50, respecti

e b) d stra a mesma onsistência na lações comsvios de -4,3% (3,4 e 5,1, meno

s simu

valorede uma só equ

tos), +0,3% (0,6um desemp nferio dos os outros modelos testad

 por esta razão, não é uma alternativa para as d pelas duas equações, 4 

o, a opção tem que ser 4b para DAP≥20 cm.a par rvores com 5

- De todos os m testados, es elo é e apresenta as menores amplitativa d

nte conservador apresenta p surpr na estimativa da biomassa

1. Os quatro modelos estatísticos testados produze

 b2. As equações distintas para árvores com 5≤DAP<

mais consistentes que a equação única para todas as árvores com D

3. Dentre os msegui uaçõe

os testa s mntes eq

0, D *H  2,171

= 0 D1,58

-áci r med

rais;

- O mmente ividua me

mc

 por este modelo ficou também a menos de 5% da o 

entário de rminado com as sões mín recomend para os inve orestai zônia

5. O tronco rresp de ante em; ecopa correspon 8% de o fresco.

6. Do tal de vore, 65cada compar (17,8%), g ,5% ruto

 g

 

Page 123: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 123/141

 

Tabela 1: Algumas estimativas de biomassa para a floresta densa da Amazônia brasileira*.

Tipo de florest loca biomassa foa l (t) nteDen MBRA ia 26 Br ug a)

fontesa (RADA SIL) Amazôn 8 own & L o (1992 ) – cf.

*

Densa (FAO) A nia 162 Brow Lug 2a) -fonte

Densa (RADAMBRASIL) A nia 289 Brow Lug 2b) -fonte

(FAO) A nia 227 Brow Lu b) -fonte

Densa (presente) Amazônia 12.3 Fearnside (1992a) - cf. fonte*

nside (unpub. 1993) - cf.fonte*

mazô n & o (199 cf.* mazô n & o (199 cf.

*

Densa mazô n &*

go (1992 cf.

Densa (presente) Amazônia 319.9 Fear 

(*) Fonte: parcialmente reproduzida de Fearnside et al. (1993)

anco de D e Bioma INPA (n 5).ão de Fr cia dos Dados Observados (n = 315).

lasse req.

Tabela 2: B ados d ssa, do = 31(a) Distribuiç eqüên 

Limites de c F %5 < 10 541 48,8910 < 20 90 28,5720< 30 28 898,30< 40 18 5,7140< 50 9 2,86

50< 60 8 2,5460< 70 3 0,9570< 80 3 950,80< 90 -0

90< 1 3200 1 0,100< 110 0 -110< 120 0 -≥120 1 0,32tota 315l 100

( stic escr Da rvad 

v riável vio Mín má

 b) Estatí a D itiva dos dos Obse os:

a média des CV(%) imo ximoD ) ,3 96 5, 12AP (cm 16,0 15 0 0,0H-total (m) 45 5,6 4117,0 7,7 ,4H-com (m) 10,7 5,2 49 2,4 26,1P-tronco (kg) 476,3 1299,3 273 4,5 12736,5P-copa (kg) 306,4 1031,5 337 0,6 12897,9P-total (kg) 782,7 2271,1 290 9,1 25634,4copa (%) 31 1 45 2 70

Page 124: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 124/141

 

(c) Estatística Descritiva dos Dados Observados, Divididos em Algumas Classes de Diâmetro:

s d nú AP T TotalClasse e mero D altura otal Pesodiâmetr casos m C C CV(%)o édia V(%) média V(%) média5 < 10 68154 7,0 20 11,4 27 35,7

10 < 1 425 62 12,0 12 16,4 20 15,015 < 2 340 28 17,5 9 20,8 18 407,520 < 3 430 28 23,6 11 23,7 1 852,030 < 5 2 350 27 37,2 1 29,3 11 449,2>= 50 8205,4 7216 65,9 29 34,1 10

Tabela 3: D tiliz ara s de nte 8). (a) tísti riti Da serv 

el m io CV mo máximo

ados U ados p estudo Nutrie s (n = 3

Esta ca Desc va dos dos Ob ados:

variáv édia desv (%) MíniD ) 3 ,3 98,0AP (cm 9,9 20 51 9,5alt. total (m 2 0 4 41,4) 8,8 6, 56 11,alt. com (m) 17,3 3,7 22 7,5 25,0P-tronco (kg) 217,4 2449,1 11 48,7 12736,5P-copa (kg) 1595,3 2429,5 152 15,2 12898,3P-total (kg) 3742,6 3005,4 128 63,9 25634,4copa (%) 34 1 22 9 63

(b) Contribuição de cada compartim tronco, galho grosso, galho fino, folhas e flor/frutos)

no pe otal de um e e % do cada um qu é transform m PS:

PESOS tronco g.grosso g.fino olhas frutos TOTAL

ento (

so t a árvor PF de e ado e

f flor/m 6 11 434,2 50,30 1,07 2,61217,3 09,68 4 374

VERDE s ,1 19 432,6 48,87 5,41 ,772449 85,66 5 4793n 38(34) 38 38 38(8) 3838m 17,83 1,52 2,03 0165,60 0,

% total s 1 7,21 1,28 031,19 ,43 0,n 38(34) 38 38 (8)38 38m 5 6 246,6 23,58 0,80 ,30101,6 65,63 4 2238

SECO s 1552,45 1243,55 253,6 23,01 4,60 3005,38n 38 38(34) 38 38 38(8) 38m 61,11 60,56 57,22 47,56 36,73 60,28

% PF s 8,27 7,98 5,75 7,21 20,62 7,41n 38 34 38 38 8 38

m = média aritmética; s = desvio padrão amostral; n = número de observações.

 ponde ao Peso Seco.% total = contribuição do peso de cada compartimento da árvore em relação ao seu peso total.% PF = é % do Peso Fresco da árvore ou do compartimento que corres 

Page 125: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 125/141

 

Tabela 4: Informações sobre Densidade da Madeira.

Espécie 0% 25% 50% 75% 100% média DAP1 0,856 0,790 0,757 0,753 0,718 8240,775 0,2 83 0,650 820,696 0,697 0,6 0,684 0,6 0,706

3 0,879 0,903 0,866 0,741 0,724 0,823 0,914 0,536 0,521 0,499 5070,509 0,471 0, 0,5465 0,681 0,678 0,640 6510,640 0,615 0, 0,7006 8 0,807 0,653 7580,81 0,806 0,704 0, 0,8387 5 0,707 0,693 7080,72 0,711 0,704 0, 0,7178 1,027 0,990 0,946 0,929 0,961 0,971 1,0159 0,891 0,870 0,8620,862 0,846 0,866 0,89610 0,571 0,533 0,445 4800,485 0,36 ,7 0 0,52811 1,033 0,987 0311,077 1,000 1,056 1, 1,05912 0,891 0,870 0,716 8260,807 0,846 0, 0,896

média 0,804 0,783 0,756 0,71 7560,725 0, 0,803desvio 0,167 0,163 0,159 0,159 0,191 0,165 0,168mín. 0,536 0,521 0,445 4800,485 0,367 0, 0,528máx. 1,077 1,033 0,987 0311,000 1,056 1, 1,059

Tabela 5: Coeficientes de Regressão e de Determinação, Erro Padrão de Estimativa dosara Es massa (Pe ores em

  b0 r 2

Modelos Estatísticos p timar a Bio so total) de Árv pé.

Modelo b1 B2 sy.x 1 -1,497 0,972,548 1729

a -1,754 432,665 0,921 b -0,151 2,170 0,90 20352 -2,694 0,982,038 0,902 812

2 a -2,668 0,952,081 0,852 352 b -2,088 0,911,837 0,939 1973 0,077 0,900,492 716

3 a 0,0056 0,621 0,94 343 b 0,393 0,473 0,86 15084 0,001 1,579 2,621 0,94 540

4 a 0,0336 2,171 1,038 0,94 314 b 0,0009 1,585 2,651 0,92 1159

 b0, b1 e b2 = estimadores dos parâmetros β0, β1 e β2, respectivamente.r 2 = coeficiente de determinação ajustador y.x = erro padrão de estimativa.

- modelo 1: ln Pi = b0 + b1 ln Di; sendo (1) para DAP≥5 cm e i = 1,..., 315; (1a) para5≤DAP<20 cm e i = 1,..., 244; e (1b) para DAP≥20 cm e i = 1,..., 71.

- modelo 2: ln Pi = b0 + b1 ln Di + b2 ln Hi; sendo (2) para DAP≥5 cm e i = 1,..., 315; (2a) para5≤DAP<20 cm e i = 1,..., 244; e (2b) para DAP≥20 cm e i = 1,..., 71.

- modelo 3: Pi = b0 + b1 Di2Hi; sendo (3) para DAP≥0,05 m e i = 1,..., 315; (3a) para

0,05≤DAP<0,20 m e i = 1,..., 244; e (3b) para DAP ≥ 0,20 m e i = 1,..., 71.

- modelo 4: Pi = b0 D b1 H  b2; sendo (1) para DAP≥5 cm e i = 1,..., 315; (1a) para 5≤DAP<20cm e i = 1,..., 244; e (1b) para DAP≥20 cm e i = 1,..., 71.

Page 126: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 126/141

 

Tabela 6: Resumo das simulações utilizando diferentes intensidades de amostragem (tomadasaleatoriamente do banco de dados).

Biomassa Observada(observada e estimada) equações a & b equação única

observada 782,7   banco de dados modelo 1 768,2 [ -1,9 ] 907,7 [+16,0 ]

modelo 2 754,6 [ -3,6 ] 805,2 [ +2,9 ] (n = 315) modelo 3 792,1 [ +1,2 ] 783,3 [ +0,1 ] 

modelo 4 746,9 [ -4,6 ] 725,3 [ -7,3 ] observada 794,1 

amostra com n = 300 modelo 1 779,1 [ -1,9 ] 924,1 [ +16,4 ] modelo 2 765,5 [ -3,6 ] 817,0 [ +2,9 ] 

(5 repetições) modelo 3 803,3 [ +1,2 ] 794,7 [ +0,1 ] modelo 4 760,2 [ -4,3 ] 738,9 [ -7,0 ] 

observada 784,2 amostra com n = 200 modelo 1 788,3 [ +0,5 ] 944,2 [ +20,4 ] 

modelo 2 770,0 [ -1,8 ] 826,4 [ +5,4 ] (5 repetições) modelo 3 808,1 [ +3,1 ] 801,3 [ +2,2 ] 

modelo 4 786,3 [ +0,3 ] 740,2 [ -5,6 ] observada 844,8 

amostra com n = 100 modelo 1 866,9 [ +2,6 ] 1052,4 [ +24,6 ] modelo 2 835,4 [ -1,1 ] 900,5 [ +6,6 ] 

(10 repetições) modelo 3 876,6 [+3,8 ] 865,1 [ +2,4 ] modelo 4 811,3 [ -4,0 ] 790,8 [ -6,4 ] 

observada 836,2 amostra com n = 50 modelo 1 750,8 [ -10,2 ] 859,3 [ +2,8 ] 

modelo 2 757,2 [ -9,4 ] 799,8 [ -4,4 ] ( 795,8 [ -4,8 ] 779,1 [ -6,8 ] 15 repetições) modelo 3

modelo 4 771,8 [ -7,7 ] 750,8 [ -10,2 ] 

Page 127: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 127/141

 

 Bibliografia

Ar aRegião Amazônica. Tese de Doutorado, Universidade Estadual Paulista, Faculdade de

aratinguetá, 212 p..

n Deforestation and Global Warming: Carbon Stocks inVe

: an Example fromRo

on of Regression Models for etermination in Amazonia Rainforest. Forest Ecology and

Regressão para Estimar a Fitomassa da FlorestaTr 

 

aújo, T.M. 1995. Investigação das Taxas de Dióxido de Carbono Gerado em Queimadas n

Engenharia de Gu

Brown, S., A.J.R. Gillespie e A.E. Lugo. 1989. Biomass Estimation Methods for TropicalForests with Applications to Forest Inventory Data. Forest Science, 35(4):881-902.

Carvalho Jr., J.A., J.M. Santos, J.C. Santos, M.M. Leitão e N. Higuchi. 1995. A TropicalRainforest Clearing Experiment by Biomass Burning in the Manaus Region. AtmosphericEnvironment 29(17):2301-2309.

Fearnside, P.M., N. Leal Filho e F.M Fernandes. 1993. Rainforest Burning and the GlobalBudget: Biomass, Combustion Efficiency, and Charcoal Formation in the BrazilianAmazon. J. of Geophysical Research, 98(D9):16733-16743.

Fearnside, P.M. 1996. Amazoniagetation Replacing Brazil’s Amazon Forest. Forest Ecology and Management 80:21-

34.

Foster Brown, I., D.C. Nepstad, I.O. Pires, L.M. Luz e A.S. Alechandre. 1992. CarbonStorage and Land-use in Extractive Reserves, Acre, Brazil. Environmental Conservation19(4):307-315.

Foster Brown, I., L.A. Martinelli, W. Wayt Thomas, M.Z. Moreira, C.A. Cid Ferreira e R.A.Victoria. 1995. Uncertainty in the Biomass of Amazonian Forests

ndônia, Brazil. Forest Ecology and Management, 75:175-189.

Higuchi, N. e J.A. Carvalho Jr. 1994. Fitomassa e Conteúdo de Carbono de Espécies Arbóreasda Amazônia. Em: Anais do Seminário “Emissão x Seqüestro de CO2 - Uma Nova

Oportunidade de Negócios para o Brasil”:127-153.Higuchi, N., J.M. dos Santos, M. Imanaga e S. Yoshida. 1994. Aboveground Biomass

Estimate for Amazonian Dense Tropical Moist Forests. Memoirs of the Faculty of Agriculture, Kagoshima, 30(39):43-54.

Overman, J.P.M., H.J.L. Witte e J.G. Saldarriaga. 1994. EvaluatiAbove-ground Biomass DManagement, 10:207-218.

Saldarriaga, J.G., D.C. West, M.L. Tharp e C. Uhl. 1988. Long-term Chronosequence of Forest Sucession in the Upper Rio Negro of Colombia and Venezuela. Journal of Ecology76:938-958.

Salomão, R.P., D.C. Nepstad e I.C.G. Vieira. 1996. Como a Biomassa de Florestas TropicaisInflui no Efeito Estufa. Ciência Hoje, 21(122):38-47.

Santos, J. dos. 1996. Análise de Modelos deopical Úmida de Terra-firme da Amazônia Brasileira. Tese de Doutorado,

Universidade Federal de Viçosa, 121 p..

Schroeder, P.E. e J.K. Winjum. 1995. Assessing Brazil’s Carbon Budget: II. Biotic Fluxesand Net Carbon Balance. Forest Ecology and Management, 75(87-99).

Skole, D.L., W.H. Chomentowski, W.A. Salas e A.D. Nobre. 1994. Physical and HumanDimensions of Deforestation in Amazonia. BioScience, 44(5):31-321.

Page 128: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 128/141

 

Capítulo 17Cadeia de Markov para predizer a dinâmica da floresta amazônica

r de inúmeras

s dificuldades, aproximadamente 1 milhão de hectares de florestaazôn

sição durante o intervalo de tempo (t e t+1) dependem apenas no estado

tempo” de cada uma das probabilidades detransição é uma i afinidade com o

atriz de transição é um modeloclassificado em tamanho ou uma forma da m lie. A única exigência deste modelo édivisibilidade da população em grupo de existam probabilidades de movimento

rtância do entendimento dos ecossistemas

 ples função matemática (linear, polinomial ou

17.1. Introdução:

Estudar a dinâmica da floresta tropical úmida amazônica, manejada ou não, é umgrande desafio para os florestais. Os modelos clássicos de produção florestal foramdesenvolvidos para florestas temperadas e têm como principais variáveis, o índice de sítio eidade da árvore ou do povoamento (Sullivan e Clutter, 1972; Ferguson e Leech, 1978; Alder,1980; Smith, 1983 e Clutter et al., 1983). Essas duas variáveis são limitantes para odesenvolvimento de modelos de produção para as florestas da Amazônia porque são

  praticamente indisponíveis para o setor florestal, num curto prazo. Apesatentativas, por meio da dendrocronologia ou da datação com 1C, a determinação das idadesdas inúmeras espécies que ocorrem numa determinada área, continua sendo um grandeobstáculo para a ciência florestal.

Sem a idade da árvore ou do povoamento ou com muita dificuldade para obte-la, aalternativa é prognosticar a dinâmica da floresta com o uso de parcelas permanentes. NaAmazônia, entretanto, as parcelas instaladas e devidamente monitoradas são poucas, maldistribuídas e recentes (as mais antigas estão na Flona de Tapajós, desde 1978). Considerandoque as idades de árvores com DAP > 50 cm, na região de Manaus, podem variar de 200 a 100anos, segundo Chambers et al. (1998), 20-30 anos de observações podem parecer insuficientes

 para descrever, com confiança, a dinâmica de uma floresta da Amazônia.

Apesar de todas essaam ica são manejados, anualmente, para produção madeireira sob algum tipo de manejoem regime de rendimento sustentável. É difícil imaginar como os empresários florestais vão

 planejar os ciclos de corte subseqüentes, sem um modelo de produção. Se nada for feito, omanejo florestal tomará a mesma forma da agricultura itinerante. A melhor saída para estasituação é usar modelos de curto prazo que dependem exclusivamente da situaçãoimediatamente anterior ao atual, tendo como objetivo a projeção apenas para uma situaçãoimediatamente posterior. Dentre os vários modelos disponíveis, o que melhor se ajusta àscaracterísticas das florestas da Amazônia, é a cadeia de Markov.

17.2. Cadeia de Markov:

A cadeia de Markov de primeira ordem é um processo estocástico no qual as probabilidades de trando indivíduo no tempo t ou no conhecimento do passado imediato no tempo t+1 e não em

qualquer outro estado prévio (Horn, 1975; Chiang, 1980 e Bruner e Moser, 1973). Shugart(1984) enfatiza que a natureza “invariável em

mportante característica da cadeia de Markov, tendo muitacomportamento dos ecossistemas florestais.

De acordo com Bierzychudek (1982), um modelo de matriz de Les

estados e quede um estado para outro, com o passar do tempo (Enright e Ogden, 1979).

Shugart e West (1981) apontam que a impoflorestais não é baseada nas idades, mas sim nas mudanças conhecidas no presente. Os

modelos determinísticos consistindo de uma sim

 

Page 129: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 129/141

 

exponencial) não demonstraram ainda que são comprovadamente adequados, quando séries de

s, o atributo tamanho pode ser ais i o ue o tamanho pode ser mais

colog ament inform vo que dade uando esta é difícil de ser obtida com precisão.iclos de vida em estágios defuturo mais precisamente do

ue a divisão em puras classes de idade. Usher (1966) usou o atributo tamanho no lugar da

que está na i-ésima classe no tempo t, pode permanecer na mesma classe, mudar 

lacionados com a dinâmica da floresta

it em Nova York (Bierzychudek, 1982); dinâmica

resta montana temperada da Nova Zelândia (Enright e Ogden, 1979);sucessã r, 1979); sucessão florestal na Nova Jersey (Horn, 1975);aplicação d estudos de dinâmica florestal em florestas tropicais(Aceve

istas. Na região de Manaus, Higuchi (1987) usou Markov para estudar a dinâmicadas par de manejo florestal (Projeto Bionte) e Rocha (2001) nostransec balhos citados anteriormente inclui revisões

m outras leituras úteis sobre o assunto,hiang (1980) e Anderson e Goodman (1957).

depender ap ente (Chiang, 1980).

de indivíduos na classe j no tempo t+1, dada a classe i no tempo t e n  j =número

  n 

estados 

tempo são envolvidas (Morrison, 1976).

Segundo Enright e Ogden (1979), nas florestas tropi i  portan e d a de. Uma razão pa sso q

cam m t que ida ra i ée ic e ati do a i , q

deAlém disso, segundo ainda os mesmos autores, a divisão cesenvolvimento pode permitir a predição do comportamentod

qidade para desenvolver um modelo para o manejo de recursos renováveis. Ele afirma que umorganismo

 para a classe seguinte (mais de uma classe também) ou morrer, no tempo t+1.

Os modelos que usam matriz de transição são apropriados para análise de muitos problemas biológicos, principalmente em estudos re(Enright e Ogden, 1979). Esses modelos têm sido usados intensivamente em estudos dedinâmica de populações de plantas ou animais em várias regiões do mundo. Alguns exemplos

são: a demografia do jack-in-the-pulpflorestal de uma população de Araucaria numa floresta tropical úmida de Papua Nova Guineae  Nothofagus em flo

o de térmitas em Gana (UsheMarkov ema Cadeia de

do, 1981) e a aplicação de Markov para predizer o desenvolvimento de um povoamento florestal (Usher, 1966; Usher, 1969, Bruner e Moser, 1973; Peden et al., 1973 eBuogiorno e Michie, 1980).

Alder (1980) também descreve a matriz de transição como uma possível ferramenta  para análise de dados de crescimento e incremento de povoamentos multianos de florestas

tropicais mcelas testemunhas do projetotos do projeto Jacaranda. A maioria dos tra

tambérazoáveis da teoria do método de Markov. Hácomo Grossman e Turner (1974), C

3. Aplicação de Markov aos dados das parcelas permanentes da ZF-2:

Primeiro vamos considerar: (i) estados i e j = 1, 2, ..., m; (ii) tempos de observação t =0, 1, .., T; (iii) p ij (t+1) (i, j = 1, 2, ..., m) = probabilidade do estado  j no tempo t+1, dado oestado i no tempo t.

Um processo Markov é considerado homogêneo em relação ao tempo ou tempohomogêneo, se a probabilidade de transição

 p ij (t, t+1) = Pr [x(t+1) = j | x(t) = i], para i, j = 1, 2, ...., m.

enas da diferença entre t e t+1, mas não de t e t+1 separadam

A montagem da matriz começa com o cálculo de

 p ij = n ij / n  j 

onde: n ij = númerototal de indivíduos na classe i no tempo t.

A matriz de transição probabilística de uma cadeia de Markov para um processo de

 pode ser montada da seguinte maneira:

Page 130: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 130/141

 

 

sendo q pim deve ser 

 pulação vai de um estado i de uma

Exemplo did

j=1 j=2 j=3 ...... j=mi=1 p11 p12 p1 ...... p1m i=2 p21 p22 p23 ...... p2m

P = (p ij) = i =3 p31 p32 p33 ...... p3m . . . . . .

. . . . . .i=m pm1 pm2 pm3 ...... pmm 

ue as probabilidades p ij são não-negativos e a soma de pi1 + pi2 + ... +igual a 1.

A probabilidade de transição p ij pode ser de n passos, tomando a forma de p ij(n) onde

n indica o número de tentativas, ou seja, a probabilidade que a potentativa para o estado j, n tentativas depois.

ático: Projeções da dinâmica de Parcelas Permanentes usando Markovctos Leste-Oeste e Norte-Sul)

 No caso dos

(transe

dados da parcela permanente do exemplo, vamos considerar 17 estados (i, j = 1, 2, ...17),

estado

estados cm e vão de 10,  passando pela classe truncada DAPmovimecom DA ou DAP= 81), em 200 ,

Passos

1. Matr dinâminenhum ia nas instruções contidas no Box por achar completamente obsoleta.Hoje, e pelos florestais, é um poderoso e

 prático strum nto p rabalha com parcelas permanentes,re-med as em várias ica serve também para conferir o

arquivo lunas e 19 linhas..1. => total 1ª ocasião = (total, freqüência da linha 19 e coluna 19 ou f 19,19 =6251)

me 6) = 5623

51) menos mortas (M, f 19,18 = 264) = 5987

2. Matr A matr Portanto B1 = B2.

e 3ª (20<25).

/396 e 4/396.

onde:

1 = recrutamento (R )

de 2 a 16 = classes de diâmetro. As classes de DAP são de 5-5≥ 75 até à classe “próxima” depois de DAP ≥ 75. A

ntação de uma classe para outra, no caso da classe DAP ≥ 75, pode ser uma árvoreP = 78, em 2000, que passou para a classe seguinte (podendo ser DAP = 80

4 ou também uma com DAP = 119, em 2000, que passou para a classe seguinteem 2004.

estado 17 = mortalidade (M)

são considerados: t = 2000 e t+1 = 2004.

para o cálculo matricial:

iz A (Quadro 1) => transição entre a 1ª ocasião (2000) e 2ª ocasião (2004) => tabelascas do Excel (V. Box). Daqui uns 10 anos, é bem provável que alguém não vejaa importâncm 2007, apesar deste recurso ser pouco conhecidoin e ara organizar os dados. Quando se t

id ocasiões sucessivas, a tabela dinâm

de dados. A matriz A é simétrica; portanto, há 19 co1

nos recrutas (R, linha 3 e coluna 19 ou f 3,19 = 39

1.2. => total 2ª ocasião = (total, f 19,19 = 62

iz B1 e B2 (Quadro 2) => probabilidades de mudanças de um estado (i) para outro (j).iz de probabilidade é repetida pra facilitar a multiplicação de matrizes no Excel.

2.1. Recrutas (R) => das 396 árvores recrutadas em 2004 => 385, 7 e 4,respectivamente, foram recrutadas para a 1ª classe (10<15), 2ª (15<20)

2.2. Probabilidades de 2.1. => 385/396, 7

 

Page 131: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 131/141

 

2.3. 1ª classe (10<15) => das 2167 árvores que estavam na 1ª classe na 1ª ocasião(2000) => na 2ª ocasião (2004), 1869 permaneceram na 1ª classe, 205 mudaram para a2ª classe, 2 passaram para a 3ª classe e 91 morreram.

2.4. Probabilidades de 2.3. => 1869/2167, 205/2167, 2/2167 e 91/2167.

2.5. 2ª classe (15<20) => das 1319 árvores que estavam na 2ª classe na 1ª ocasião

3. Mat(Matrizadiante

espaço igual à matriz

de linhas e mesmo número

ente a matriz B e OK;

- truque pra ver o resultado (matriz C) => segurar juntos Ctrl, Shift e  Enter  ção ( fx ) que fica acima da planilha.

atrizes (B1 e B2) não inclui a coluna TOTAL, portanto, é

95 * 396 = 332,05

D4*T4 = 0,7288 * 1319 = 961,24

e assim por diante para todas as classes.

4.3. O total da freqüência esperada por classe ou estado (que a projeção para 2008) écalculado da seguinte forma (dados da Matriz D):

- classe 10<15 => C2 + C3 = 332,05 + 1612 = 1944.

- classe 15<20 => D2 + D3 + D4 = 42,39 + 351,81 + 961,24 = 1355,5 

e assim por diante para todas as classes.

(2000) => na 2ª ocasião (2004), 1126 permaneceram na 2ª classe, 144 mudaram para a3ª classe, 1 passou para a 4ª classe e 48 morreram.

2.6. Probabilidades de 2.5. => 1126/1319, 144/1319, 1/1319 e 48/1319.

riz de probabilidade 2 passos adiante (até 2004) => matriz de transição probabilísticaB) elevada ao quadrado que resultará na Matriz C (Quadro 3). Se quiser 3 passos

, a matriz de transição probabilística será elevada ao cubo.

3.1. Multiplicação de matrizes (B1*B2) => No Excel:

- blocar (passando o cursor em toda a sua extensão) um

que será multiplicada (Matriz B), ou seja, mesmo númerode colunas;

- ir ao menu Inserir , selecionar a opção Função e escolher  Matriz.Mult ;

- definir matriz 1 (B1), blocando a matriz B;

- definir matriz 2 (B2), blocando novam

mantendo o cursor dentro da barra de fun

- Obs.: a matriz B não deve estar como fórmula e sim como Somente Valores.

4. Projeção para 2008 => Matriz D (Quadro 4) =>4.1. A multiplicação de mnecessário copiá-la da Matriz A e colá-la na Matriz C para facilitar o cálculo dafreqüência esperada por classe (Matriz D);

4.2. A Matriz D é calculada multiplicando a probabilidade de ocorrência de árvoresem uma classe dois passos a diante (Matriz C) pelo número total de árvores daquelaclasse. Ex.:

- classe 10<15 => C2*T2 = 0,83

C3*T3 = 0,7439 * 2167 = 1612

- classe 15 < 20 => D2*T2 = 0,1071 * 396 = 42,39D3*T3 = 0,1624 * 2167 = 351,81

Page 132: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 132/141

 

4.4. Clárvores

asse “PRÓX.” => esta classe é criada apenas para descrever a dinâmica dastruncadas ao DAP ≥ 75 cm. No quadro com as freqüências esperadas (E) (5b)

deve ser somada à da classe “PROX”:

  possa ser incluída na projeção de 2008. Enquanto não tiver uma série histórica de

5a: (prob do nº de arv da 1ª classe – 

 – 47) + (396 * 0,0177) ≅ 1316

6. Se 3 ocasiões estão disponíve

7. Com ), para 2008, fornecida pela Cadeia de Markov

2

Usa o ponto de vista de estatística, pode-se

imed , para confirmar a eficiência de Markov. O exemplo foi usado para

ma floresta

a freqüência da classe “PRÓX” deve ser acrescentada à classe DAP ≥ 75 cm. Portanto,a freqüência esperada da classe DAP ≥ 75 cm

- classe DAP ≥ 75 cm => Q19 + R19 = 11,56 + 4,407 = 15,963 (Quadro 5a)

5. Ajustes necessários => a cadeia de Markov não faz projeções do recrutamento. Portanto, hánecessidade de fazer ajustes para que a probabilidade de recrutamento das árvores em 2004

recrutamento, o único recurso é usar o nº de indivíduos recrutados de uma ocasião para outra.

5.1. O ajuste é feito com os dados do Quadro prob da mortalidade da 1ª classe) + (Total de recrutas de 2004 * projeção da 1ª classe para 2008). Ex.:

- classe 10<15 => (1944 – 86) + (396 * 0,9722) ≅ 2242,3

- classe 15<20 => (1355,5

- classe 20<25 => (865,8 – 33) + (396 * 0,0101) ≅ 837

5.2. Para as classes onde não houve recrutamento em 2004, basta diminuir a prob do nºde arv da classe sem recrutamento – prob da mortalidade dessa mesma classe. Ex.:

- classe 25<30 => 543,4 – 24 ≅ 519

...

- classe DAP ≥ 75 cm => 15,96 - 3 ≅ 13

is, o certo é usar a média [ R = (R1+R2)/2 ], sendo que R1 é o

nº indivíduos recrutados entre a 1ª e 2ª ocasião e R2 é o nº entre a 2ª e 3ª ocasião, ou seja,seriam necessários 3 inventários.

 paração entre freqüências esperadas (Ee as freqüências observadas de fato em 2004 (Quadro 6) => teste qui-quadrado ( χ 2 ).

  Neste exemplo, como o χ  tabelado com 13 graus de liberdade e p = 0,05 é igual a22,36, isso significa dizer que há fracas evidências para afirmar que E seja diferente de O.

ndo p = 0,01, o valor de χ 2 é igual a 27,69 e, dafirmar que o teste é não significante.

O certo seria usar um intervalo de tempo maior para fazer projeções para um períodoiatamente posterior 

comprovar que Markov é eficiente para fazer projeções da dinâmica de umanejada. Essa comprovação já tinha sido realizada em florestas não perturbadas (Rocha,2001).

Page 133: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 133/141

 

Bibliografia:

Acevedo, M.F. 1981. On Horn’s Markovian Model of Forest Dynamics with Particular Reference toTropical Forests. Theoretical Population Biology 19:230-250.

er, D. 1980. Forest Volume EsAld timation and Yield Prediction. V.2 – Yield Prediction.

And ins.  Annals

. Ecol. Monographs 52(4):333-351.

Bruner, H.D. e J.W. Moser Jr.. 1973. A Markov Chain Approach to the Prediction of Diameter Distributions in Uneven-aged Forest Stands. Can.J.For.Res. 3:409-417.

Buogiorno, J. e B.C. Michie. 1980. A Matrix Model of Unever-aged Forest Management.Forest Science 26:609-625.

Chambers, J.Q., N. Higuchi e J.P. Schimel. 1998. Ancient Trees in Amazonia.  Nature,391:15-16.

Chiang, C.L. 1980. An Introduction to Stochastic Processes and their Applications. Robert E.Krieger Publ. Co., Huntington, New York.

Clutter, J.L., J.C. Fortson, L.V. Pienaar, G.H. Brister e R.L. Bailey. 1983. Timber Management: A Quantitative Approach. John Wiley and Sons, Inc. New York. 333p.

Enright, N. e J. Ogden. 1979. Applications of Transition Matrix Models in Forest Dynamics: Araucaria in Papua New Guinea and  Nothofagus in New Zealand.   Australian J. of  Ecology 4:3-23.

Ferguson, I.S. e J.W. Leech. 1978. Generalized Least Squares Estimation of Yield Functions.Forest Science 24:27-42.

Grossman, S.I. e J.E. Turner. 1974. Mathematics for the Biological Sciences. Macmillan Publ.Co., Inc. New York. 512p.

Higuchi. N. 1987. Short-term Growth of an Undisturbed Tropical Moist Forest in theBrazilian Amazon. Tese de Doutor. MSU. 129p.

Horn, H.S. 1975. Markovian Properties of Forest Succession. In: Ecology and Evolution of Communities (M. Cody e J. Diamond, editores), pp.196-211. Harvard University Press.Cambridge, Mass.

Morrison, D.F. 1976. Multivariate Statistical Methods. McGraw-Hill Inc.. 415p.

Peden, L.M., J.S. Williams e W.E. Frayer. 1973. A Markov Model for Stand Projection.Forest Science 19:303-31.

Rocha, R.M. 2001. Taxas de recrutamento e mortalidade da floresta de terra-firme da bacia dorio Cueiras na região de Manaus-AM. Dissertação de mestrado CFT-INPA. 49p.

Shugart, H.H. 1984. A Theory of Forest Dynamics: The Ecological Forest SuccessionModels. Springer-Verlag Inc. New York. 278p.

Shugart, H.H. e D.C. West. 1981. Long-term Dynamics of Forest Ecosystems.  Am. Scientist  69:647-652.

FAO Forestry Paper 22/2. 194 p.erson, T.W. e L.A. Goodman. 1957. Statistical Inference about Markov Chaof Mathematical Statistics 28:89-110.

Bierzychudek, P. 1982. The Demography of Jack-in-the-pulpit, a Forest Perennial thatChanges Sex

 

Page 134: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 134/141

 

 

ith, V.G. 1983. Compatible Basal Area Growth and Yield Models Consistent with ForestGrowth Theory. Forest Science 29:279-288.

Sullivan, A.D. e J.L. Clutter. 1972. A Sim us Growth and Yield Model for LoblollyPine.

e Management of Renewable Resources, with

ccession. J. of Animal Ecology 

Sm

ultaneoForest Science 18:76-86.

Usher, M.B. 1966. A Matrix Approach to thSpecial Reference to Selection Forests. J. of Applied Ecology 3(2):355-367.

Usher, M.B. 1969. A Matrix Model for Forest Management. Biometrics, June:309-315.

Usher, M.B. 1979. Markovian Approaches to Ecological Su48:41-426.

Page 135: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 135/141

 

 

Box 1

Tabel âmica do Excel usando o mesmo arquivo de dados do T2-B2SB4.a din

Passos necessários:1. Neste arquivo há as seguintes colunas: nome comum da espécie, DAP90, DAP97 e DAP04

2. Inserir três novas colunas entre DAP90 7 e DAP04 e depois dee DAP97, entre DAP9DAP04 e nomear como CD1, CD2 e CD3, respectivamente.

3. Clicar e para a transição entrem DADOS => FILTRAR => AUTO-FILTRO => apenas1990 e 1997. Para a transição entre 1997e 2004, o procedimento é o mesmo.

4. Identificar as recrutas ap “zero” na coluna do=> são células que arecem em “branco” ouDAP90 e luna DAP97 => clicar em DAP90▼ e procurar “branco” em DAPs registrados na co“zero” e nomear com R na própria coluna DAP90 e na coluna CD1 atribuir o código “1” =>

 para todas as árvores nessas condições.5. Calcu as freqüências das classes 10<15, 15<20 ... até ≥ 65 => continuar com olar FILTRAR nas colunas DAP90 e DAP97. Começar com 1990 clicando em DAP90▼ e ir paraPERSONALIZAR. Lembrar que a primeira classe (10<15) é o segundo estado. EmPERSONALIZAR, a primeira condição é “maior ou igual a” “10” (digitando) e a segunda é“menor d ue” “15” (digitando). Depois de OK, digitar em CD1 o número da classe (2, nesteo qcaso). Repetir isso até a última classe (≥ 65), que será a classe número 1.

6. Identi r as mortas => são c u s que aparecem emfica él la “branco” ou “zero” na coluna doDAP97 e tinham DAPs na coluna DAP90 => clicar em DAP97▼ e nomear com M na própriacoluna DAP97 e na coluna CD2 atribuir o código “15” => para todas as árvores nessas

condições.7. Repetir passo 5 para DAP97. Em DAP97 tem que incluir a classe 1 (PRÓX). Neste caso, otrabalho que ser feito manualmente (no olho), ou seja, tem que olhar para as colunastemDAP90 e AP97 e verificar quais árvores que estavam na classe 1 em 1990 e mudaram deDclasse em 1997.

8. Ir pra DADOS, clicar em FILTRAR e retirar o AUTO-FILTRO.

9. Em COS DINÂMICOS eDADOS, clicar em RELATÓRIOS DE TABELA E GRÁFIseguir as instruções lógicas.

10. Pra ter a tabela dinâmica:

- arrastar CD1 até a coluna onde está escrito “solte campos de linha aqui”

- arrastar C escrito “solte camD2 até a linha onde está pos de coluna aqui”

- star D P97 em cima de “solte itens de dados a i”arra A qu

Page 136: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 136/141

 

Quadro 1: Matriz (A) => transição do estado i para o estado j durante o período de 2000 a 2004.

A B C ID E F G H J L M N O P

1 estados R 10 < 15 15 < 20 20 < 25 25 < 30 30 < 35 35 < 40 40 < 45 45 < 50 50 < 55 55 < 60 60 < 65 65 < 70 70 < 75 2 0R 385 7 4 0 0 0 0 0 0 0 0 0 0

3 0 1869 205 0 0 10 < 15 2 0 0 0 0 0 0 0 0

4 0 0 0 0 15 < 20 0 1126 144 1 0 0 0 0 0 0

5 0 0 20 < 25 0 711 104 4 0 1 0 0 0 0 0 0

6 0 25 < 30 0 0 0 419 59 0 0 0 0 0 0 0 0

7 0 30 < 35 0 0 0 0 276 59 0 0 0 0 0 0 0

8 0 35 < 40 0 0 0 0 0 195 23 0 0 0 0 0 0

9 0 0 40 < 45 0 0 0 0 0 119 27 1 0 0 0 0

10 45< 50 0 00 0 0 0 0 0 0 72 14 0 0 0

11 50< 55 0 0 0 0 0 0 0 0 0 0 36 7 0 0

12 55< 60 0 0 0 0 0 0 0 0 0 0 28 6 1 0

13 60< 65 0 0 00 0 0 0 0 0 0 0 19 8 0

14 65< 70 0 0 0 0 0 0 0 0 0 0 0 0 12 4

15 70< 75 0 0 0 0 0 0 0 0 0 0 0 0 0 15

16 0>=75 0 0 0 0 0 0 0 0 0 0 0 0 0

17 0 PROX 0 0 0 0 0 0 0 0 0 0 0 0 0

18 0 0M 0 0 0 0 0 0 0 0 0 0 0 0

19 0 4 1 8 861 524 339 254 143 Total 225 33 99 51 35 25 21 19

 

Page 137: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 137/141

 

Quadro 2: Matriz B (B1 e B2) – transição probabilística do estado i para o estado j durante o período de 2000 a 2

B C D J L A E F G H I M N O P

1 estados R 15 20 5 40 < 45 4 50 55 60 5 < 0 < 10 < 15 < 20 < 2 25 < 30 30 < 35 35 < 40 5 < 50 < 55 < 60 < 65 6 70 7 75 2 0 2 7 1 0 0 0 0 0 0R 0,972 0,017 0,010 0 0 0 0

3 10 0 5 6 9 0 0 0 0 0 0< 15 0,862 0,094 0,000 0 0 0 0

4 15 20 0 7 2 0 0 0 0 0 0 < 0 0,853 0,109 0,0008 0 0 0

5 20 25 0 0 0,8335 0,0047 0,0012 0 0 0 0 < 0 0,1219 0 0 0

6 25 < 30 0 0 0 0 0 0 0 0 0 00 0,8347 0,1175 0

7 30 35 0 0 0 0 0 0,7645 0 0 0 0 0 0< 0,1634 0

8 35 < 40 0 0 0 0 0 0,1009 0 0 0 0 0 0 0,8553 0

9 40 < 45 0 0 0 0 0 0 0 0,7677 0,1742 0,0065 0 0 0 0

10 45 50 0 0 0 0 0, 0 0 0< 0 0 0 0 0,7742 1505 0

11 50 55 0 0 0 0 0 0, 0,1 0 0< 0 0 0 0 7826 522 0

12 55 60 0 0 0, 0,1 0, 0< 0 0 0 0 0 0 0 0 6829 463 0244

13 60 65 0 0 0 0 0 0 0 0 0 0 0 0,6 0, 0< 786 2857

14 65 70 0 0 0 0 0 0 0 0 0 0 0 0 0,< 7059 0,2353

15 70 75 0 0 0 0 0 0 0 0 0 0 0 0 0 < 0,8333

16 0 0 0 0 0 0 0 0 0 0 0 0 0 0>=75

17 PROX 0 0 0 0 0 0 0 0 0 0 0 0 0 0

1 M 0 0 0 0 0 0 0 0 0 0 0 0 0 0 8

19 Total

Page 138: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 138/141

 

 

e (até 2008)

F G J L

Quadro 3: Matriz C ou [B]2 - Matriz de transição probabilística dois passos adiant 

A B C D E H I M N O P

1 estados R 10<15 15<20 20<25 25<30 30<35 35<40 40<45 45<50 50 5 70 <7<55 5<60 60<65 65< 702 0, 0, 5E 1E 0 0 0 0 0 0R 0,0000 8385 1071 0,0112 0,0012 -05 0 -05

3 0, 0, 0, 0, 0, 4E- 1E- 0 0 0 0 0 010<15 0000 7439 1624 0119 0002 06 0 06

4 <2 0, 7 ,18 , , 0, 0 0 0 0 0 015 0 0 0000 0, 288 0 42 0 0146 0 0006 0 0001

5 <2 0 0, 6 20 , 8E- 0 020 5 0 0000 0, 948 0, 34 0 0218 0,0008 0,0019 0,0002 06 0 0

6 0, 0 0 0 025<30 0 0 0 0000 0,6967 0,188 0,0192 0 0 0

7 0 0 0 0 0, 0,0165 0 0 0 0 0 030<35 0000 0,5845 0,2647

8 <4 0 0 0 0 0,0 7 0,1 0,017 0,00 0 0 0 035 0 0 000 0, 315 637 6 07

9 <4 0 0 0 0 0 0 0,0 5 0,2 0, 0, 0 040 5 000 0, 894 686 0362 001 0

10 0 0 0 0 0, 0, 0, 0229 0 0 045<50 0 0 0 0000 5994 2344 0,

11 0 0 0 0 0 0 0 0 0, 0, 223 0,0223 050<55 0000 6125 0, 0,0037

12 6 0 0 0 0 0, 7 00555< 0 0 0 0 0 0 0000 0,4664 0,1992 0,075 0,

13 6 0 0 0 0 0 0 0 0 0 6 6760< 5 0 0,0000 0,4605 0,395 0,0

14 0 0 0 0 0 0 0 0 0 0 0 65<70 0,0000 0,4983 0,362

15 0 0 0 0 0 0 0 0 0 0 70<75 0 0 0,0000 0,694

16 7 0 0 0 0 0 0 0 0 0 0 0>= 5 0 0 0 0,00

17 OX 0 0 0 0 0 0 0 0 0 0 PR 0 0 0 0

18 0 0 0 0 0 0 0 0 0 0 0 0 0 0 M

19 talTo

Page 139: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 139/141

 

 

ncias esperadas de cada classe ou estado

A B C D E F G H I J L N O P

Quadro 4: Matriz D - Cálculo das freqüê

M

1 estados R 10 < 15 15 < 20 20 < 25 25 < 30 30 < 35 35 < 40 40 < 45 45 < 50 50 <55 5 60 <65 65 <70 70 <75 5 <60

2 R 0,000 332,056 42,397 4,454 0,493 0,019 0 0,005 0 0 0 0 0 0

3 10 < 15 0,000 1611,980 351,813 25,773 0,399 0,009 0 0,002 0 0 0 0 0 0

4 15 < 20 0 0,000 961,240 58 0 0 0 242,9 19,245 0,793 0 0,169 0 0 0

5 20 < 25 0 0 0,000 6 0 0 0 592,639 173,492 18,615 0,654 1,601 0,174 0,00 0

6 25 < 30 0 0 0 0 0 0 0,000 349,723 94,353 9,643 0 0 0 0

7 30 < 35 0 0 0 0 0,000 211,014 95,569 5,952 0 0 0 0 0 0

8 35 < 40 0 0 0 0 0 0,148 00,000 166,776 37,329 4,006 0 0 0

9 40 < 45 0 0 0 0 5,615 0, 00 0 0,000 91,361 41,632 152 0 0

10 45 < 50 0 0 0 0 0 0 0 0,000 55,7 21,795 2, 042 130 0 0

11 50 < 55 0 0 0 0 0 0 74 1 1,024 0,171 0 0 0 0,000 28,1 0,259

12 55 < 60 0 0 0 0 1 8,160 0 0 0 0 0 0,00 9,122 9 3,103 0,235 13 60 < 65 0 0 0 0 0 0 0 0 0, 12,80 0 000 93 11,076 1,882

14 65 < 70 0 0 0 0 0 0 0 0 0 0,000 8,471 6,1570 0

15 70 < 75 0 0 0 0 0 0 0,000 12,500 0 0 0 0 0 0

16 >=75 0 0 0 00 0 0 0 0 0 0 0 0 0,000

17 PROX 0 0 0 0 0 0 00 0 0 0 0 0 0

18 M 0 0 0 0 0 0 0 0 0 0 0 0 0 0

19 Total 1944,036 1355,450 65,823 543,352 324,803 272,641 136,419 101, 5,739 3 22,086 22,820 20,775 8 555 5 1,663

Page 140: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 140/141

 

Quadro 5a: Dados para calcular 2008 (E).

CDProbArv

ProbMort proj

10 < 15 1944,04 86,02 0,97

15 < 20 1355,45 46,60 0,0220 < 25 865,82 32,82 0,0125 < 30 543,35 24,2830 < 35 324,80 22,4735 < 40 272,64 9,7440 < 45 136,42 8,2445 < 50 101,55 6,3350 < 55 55,74 3,3755 < 60 31,66 4,3760 < 65 22,09 1,1565 < 70 22,82 0,9370 < 75 20,77 1,20

>=75 15,96 2,78

Quadro 5b: Freqüências esperadas (E) para 2008 incluindo ajustes feitos para o recrutamento(R)

Estado lidadeÁrvores Morta

CD 2000 2004 (O) 2008 (E)2004(O)

2008(E)

10 < 15 2167 2254 2243,0 91 86,0215 < 20 1319 1338 1315,9 48 46,60

20 < 25 853 861 837,0 33 32,8225 < 30 502 524 519,1 24 24,2830 < 35 361 339 302,3 26 22,4735 < 40 228 254 262,9 10 9,7440 < 45 155 143 128,2 8 8,2445 < 50 93 99 95,2 7 6,3350 < 55 46 51 52,4 3 3,3755 < 60 41 35 27,3 6 4,3760 < 65 28 25 20,9 1 1,1565 < 70 17 21 21,9 1 0,9370 < 75 18 19 19,6 1 1,20

>=75 27 17 13,2 5 2,78Próxima 7

Total 5855 5987 5857,6 264 250

Page 141: ESTÀTISTICA.  (biometria Florestal)

5/10/2018 ESTÀTISTICA. (biometria Florestal) - slidepdf.com

http://slidepdf.com/reader/full/estatistica-biometria-florestal 141/141

 

Quadro 6: Comparação entre freqüências observadas (O) e esperadas (E) em 2008.

estado O E χP

2P

 

10 < 15 2254 2243 0,0515 < 20 1338 1316 0,3720 < 25 861 837 0,6925 < 30 524 519 0,0530 < 35 339 302 4,4535 < 40 254 263 0,3040 < 45 143 128 1,7145 < 50 99 95 0,15

50 < 55 51 52 0,0455 < 60 35 27 2,1860 < 65 25 21 0,7965 < 70 21 22 0,0470 < 75 19 20 0,02

>=75 24 13 2,08Total 5987 5859 20,13

χP

2Ptab 0,05;13gl = 22,36

χP

2Ptab 0,01;13gl = 27,69