24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Post on 14-Dec-2015

8 views 2 download

description

estatística

Transcript of 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

AnAnAnAnAnAnAnAnáááááááálise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de DadosDadosDadosDadosDadosDadosDadosDados

Tabelas e Gráficos

Parte II: Organizando e apresentandoos dados de variáveis quantitativas

0

10

20

30

40

50

60

70

80

90

100

Sim Não

Sindicalização

%

20 30 40 50

0

10

20

IdadeMotorista

Por

cent

agem

Relembrando: Planilha de Dados

Variáveis Discretas

Distribuição de Frequências

Variáveis discretas que assumempoucos valores distintos

[ Ellison, 2004 ]

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

Florestas

Variáveis discretas que assumempoucos valores distintos

[ Ellison, 2004 ]

Pântanos

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

Comparando os dois tipos de habitats

Variável discreta que assume um grandenúmero de valores distintos

[Reis e Reis, 2001]

Solução: agrupar valores em classes

Variáveis Contínuas

Estudando a

Distribuição de Frequências

Variáveis contínuas assumem muitos valoresdistintos

Solução: agrupar valores em classes

Area das folhas, cm2

Fre

quen

cia

Abs

olut

a

5 10 15 20

020

040

060

080

0

Histograma de frequências

Gráfico para a distribuição de frequências de variáveis contínuas

10

.06

44

.89

32

.64

10

.27

1.8

2

0.2

1

0.0

5

0.0

5

Histograma de densidade

Den

sida

de

5 10 15 20

0.00

0.05

0.10

0.15

0.20

Área da barra = frequência relativa da classe

2 x 0.0514 = 0.1027

Soma das áreas de todas as barras = 100%

frequência relativa da classe

tamanho da classeDensidade =

Vantagem do histograma de densidadeD

ensi

dade

5 10 15 20

0.00

0.05

0.10

0.15

0.20 Cálculo da frequência em classes

diferentes daquelas apresentadas no histograma.

Exemplo: qual é a frequência de plantas com área foliar entre 7.0 e 11.0 cm2?

( 1 x 0.2244 ) +

( 2 x 0.1632 ) +

( 1 x 0.0513 ) = 0.6022

Simétrica

50 60 70 80 90 100 110 120 130 140 150

0

1

2

3

4

5

6

Variável

Fre

quên

cia

rela

tiva

(%)

Classificação da Distribuição de Frequências de uma

Variável Contínua quanto a sua Forma

0 10 20 30

0

1

2

3

4

5

6

7

8

9

10

Variável

Fre

quên

cia

rela

tiva

(%)

Assimétrica

92 93 94 95 96 97 98 99 100 101 102

0

1

2

3

4

5

6

Variável

Fre

quên

cia

rela

tiva

(%)

Com concentração à

esquerda

Com concentração à

direita

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Ogiva: gráfico das frequências acumuladas

O eixo horizontal utiliza os limites superiores das classes

Uma ogivasempre termina

em 100%

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Uma ogivasempre começa

em 0%

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Qual é o percentual de plantas quepossuem área foliar abaixo de 11 cm2?

92

11

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Qual é o valor de área foliar que deixa 50% das plantas abaixo dele?

50

8

Assimétrica(concentração à

direita)ou (cauda à esquerda)

Simétrica

Assimétrica (concentração àesquerda) ou (cauda à direita)

Formas básicas para a distribuição de frequências de uma variável contínua

Comparando duas distribuições de frequências

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

5 10 15 20

020

4060

8010

0

Variedade 1Variedade 2Variedade 1Variedade 2

A distribuição da área foliar das plantas da variedade 2 émais assimétrica

concentrada à esquerda

do que a distribuição da área foliar das plantas da variedade 1.

Visualizando pequenos conjuntos de dados

Diagrama de Pontos

Diagrama de Ramo-e-folhas

Diagrama de Pontos

[Reis e Reis, 2001]

Diagrama de Ramo-e-Folhas

4 4 5 6 6 6 6 6 7 7 7 8 9 9 10 10 12 14 15 16 17 18

Número de espécies de formigas em 22 pontos de coleta em habitats de floresta (valores ordenados)

4 4 5 6 6 6 6 6 7 7 7 8 9 910 10 12 14 15 16 17 18

Separando os dados pelas dezenas, uma em cada linha

Diagrama de Ramo-e-Folhas

4 4 5 6 6 6 6 6 7 7 7 8 9 9

10 10 12 14 15 16 17 18

Separando as unidades de cada dezena em dois grupos: de 0 a 4 e de 5 a 9

0| 4 4 0| 5 6 6 6 6 6 7 7 7 8 9 91| 0 0 2 4 1| 5 6 7 8

Colocando as dezenas em “evidência”

ramosfolhas

Diagrama de Ramo-e-Folhas

Ramo-e-Folhas duplo

Estudando uma variávelao longo do tempo

Gráfico de linha(Séries Temporais)

Séries temporais (ou séries históricas) são um conjunto de observações de uma mesma variável quantitativa (discreta ou contínua) feitas ao longo do tempo.

Os gráficos mais comuns para a representação de uma série temporal são os

gráficos de linha.

22252023282524221415Ovos

10987654321Semana

Número de ovos de Aedes Aegypti emovitrampas ao longo de 10 semanas

Sem

ana

Número de ovos por armadilha

24

68

10

15 20 25 30

Sem

ana

Número de ovos por armadilha

24

68

10

0 10 20 30 40

24

68

10

0 10 20 30 40

24

68

10

0 10 20 30 40

Área 1

Área 2

Área 3

1900 1920 1940 1960 1980

-6-4

-20

24

Ano

Altu

ra e

m r

elaç

ão a

um

pon

to a

rbitr

ário

Nível de água do Rio Negro

(médias mensais das observações diárias, em metros)

Gráfico de linhas para o preço médio do litro de leite “Folha de São Paulo” (set/2001)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho Agosto

Cuidados ao elaborar um gráfico de linhas : a escala do gráfico

[Reis e Reis, 2001]

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho Agosto

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho A gos to0,24

0,26

0,28

0,30

0,32

0,34

0,36

Maio Junho Julho A gos to

Efeitos da mudança no início e/ou final da escala do gráfico de linhas da série temporal

do preço do leite.

[Reis e Reis, 2001]

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

Maio Junho Julho Agosto

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

Maio Junho Julho Agosto

Efeitos de alterações na dimensão horizontal do gráfico de linhas da série do preço do leite

Alguns cuidados

• O início do eixo vertical seja o valor mínimo possível para a variável que estásendo representada (para o caso do preço de leite, o valor zero, leite de graça)

• O final do eixo vertical seja tal que a série fica centrada em relação ao eixo vertical

• Os tamanhos dos eixos sejam o mais parecidos possível .

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho Agosto

Praticando Estatística

Como fazer

histogramas, ogivas, ramo-e-folhas e

gráficos de linhas

usando o ?

Como fazer usando o R ?

Gráfico de Barras para Dados de Variáveis Discretas

Quando não se conhece as frequências das classes

(dados brutos)

ants <- read.table("ants.txt",header=T)

tabela <- table(ants$Srich[ants$Habitat=="Forest"])

barplot(tabela, ylab="Frequência Absoluta",

main="Riqueza de Espécies de Formigas",

xlab="Número de espécies de formigas",

col="darkred")

Como fazer usando o R ?

Gráfico de Barras para Dados de Variáveis Discretas

Quando já se conhece as frequências das classes

Classes <- c(1, 2, 3, 4, 5, 6) # Classes

Formigas.pantano <- c(4.0,16.0,40.0,24.0,8.0,8.0)

# Frequências Relativas das classes

names(Formigas.pantano) <- Classes #Nomes das classes

barplot(Formigas.pantano, ylab="Frequência Relativa(%)",

main="Riqueza de Espécies de Formigas",

xlab="Número de espécies de formigas",

col="darkblue")

Como fazer usando o R ?

Histograma de Frequências

hist(ciclame$Area,breaks=seq(4,20,by=2),

xlim=c(4,20), xlab="Area das folhas, cm2",

ylab="Frequencia Absoluta", main="",

col="lightgreen")

Histograma de Densidade

hist(ciclame$Area,breaks=seq(4,20,by=2),

xlim=c(4,20), xlab="Area das folhas, cm2",

ylab="Frequencia Absoluta", main="",

col="purple", freq=F)

Como fazer usando o R ?Ogiva

classes<-hist(ciclame$Area,

breaks=seq(4,20,by=2))[[1]]

frequencias<-hist(ciclame$Area,

breaks=seq(4,20,by=2))[[2]]

freq.cum<- round(cumsum(frequencias)/

sum(frequencias),4)*100

plot(classes,c(0,freq.cum),type="l",lwd=2,

xlim=c(4,20), xlab="Área das folhas, cm2",

ylab="Frequencia Relativa Acumulada",

main="",col="red")

Con

stru

indo

as c

lass

es e

fr

equê

ncia

s ac

umul

adas

Des

enha

ndo

a og

iva

Como fazer usando o R ?

Ramo-e-folhas

# Riqueza de Especies em Habitats de Floresta

stem(ants$Srich[ants$Habitat=="Forest"])

# Riqueza de Especies em Habitats de Floresta

stem(ants$Srich[ants$Habitat=="Bog"])

Como fazer usando o R ?

Gráficos de Linhas

rionegro<-read.table("rionegro.txt",header=T)

# Lendo a série temporal mensal de alturas (“height”)

plot(rionegro$Year,rionegro$Height,type="b",

xlab="Ano",

ylab="Altura em relação a um ponto arbitrário")

abline(h=0) # Linha horizontal na altura zero

Fim da terceira aula

Próxima Aula

Análise Descritiva de Dados: Organizando e apresentando Dados de

Variáveis Quantitativas

Análise Descritiva de Dados: Resumindo os Dados de Variáveis

Quantitativas

Referências Bibliográficas

REIS, E.A.; REIS, I.A. (2001) Análise Descritiva de Dados- Tabelas e Gráficos, Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br

ELLISON, A. E (2004). Bayesian inference in ecology. Ecology Letters, 7, 509–520.