Post on 24-Nov-2015
Probabilidade e
Estatstica
Aula 2
Apresentao de dados em Tabelas e Grficos
Leitura: Levine et al. Captulo 2
Cap 2-1
Objetivos
Nesta parte, vamos aprender:
A conhecer as fontes e tipos de dados
A desenvolver tabelas e grficos para conjuntos de
dados
Os princpios de apresentao adequada de grficos
Cap 2-2
Cap 1-3
Fontes de Dados A estatstica a cincia de anlise de dados que representam
uma situao onde existe incerteza.
Mas de onde vem os dados normalmente utilizados?
1) Fontes Primrias: os dados so coletados pelo pesquisador
- dados de uma pesquisa poltica
- dados coletados por um experimento*
2) Fontes Secundrias: a pessoa faz a anlise de dados coletados por terceiros.
- dados do censo (ibge, inep,)
- dados de revistas/jornais impressos ou publicados na internet
Cap 1-4
Fontes de Dados
Os dados coletados (ou amostras) devem:
ser representativos Cuidado com amostras em que as pessoas escolhem se
respondem ou no (particularmente importante em cincias sociais), podem no representar a populao.
conter informao suficiente Dificilmente podemos extrair muitas informaes de
uma amostra pequena (ex: 2 pessoas).
Mtodo usado com frequncia a seleo aleatria de indivduos a incluir na pesquisa (sorteio).
Cap 1-5
Tipos de Variveis
Categricas (qualitativas) variveis cujos valores s
podem ser colocado em categorias, tais como sim
e no, partido poltico preferido,
Numricas (quantitativas) variveis cujos valores
representam quantidades, tais como peso, renda,
nmero de filhos, nmero de mquinas,
Cap 1-6
Tipos de Variveis
Dados
Categricos
Numricos
Discretos Contnuos
Exemplos:
Estado civil
Partido politico
Cor dos olhos
(Categorias definidas) Exemplos:
Nmero de filhos
Defeitos por hora
(tens contveis)
Exemplos:
Peso
Voltagem
(Caratersticas mensurveis)
Dados e Variveis
Exerccio: O conjunto de dados abaixo descreve o consumo de
combustvel (em km/litro) para alguns modelos de seds mdios.
Cap 2-7
Modelo Montadora Direo N
de
Cilindros
Consumo
Estrada
(km/l)
Consumo
Cidade
(km/l)
Marea Fiat Hidrulica 4 11 8.2
Focus Ford Hidrulica 4 12.8 9.7
Mgane Renault Eltrica 4 10.1 7.1
Corolla Toyota Hidrulica 4 13.8 10.4
a) Quais so os indivduos (observaes) neste conjunto de dados?
b) Quais variveis so fornecidas? Quais so os tipos destas variveis?
c) Fornea uma amostra de tamanho 2 deste conjunto de dados.
Cap 2-8
Tipos de Grficos e Tabelas
Dados
Categricos
Tabela Resumida
Grfico de Pizza
Grfico de Barras
Diagrama de Pareto
Numricos
Rol Disposio
Ramo-e-Folha
Distribuio de
Frequncia Histograma
Polgono de Percentagem
Polgono de Percentagem Acumulada
Cap 2-9
Tipos de Grficos e Tabelas
Dados
Categricos
Tabela Resumida
Grfico de Pizza
Grfico de Barras
Diagrama de Pareto
Numricos
Rol Disposio
Ramo-e-Folha
Distribuio de
Frequncia Histograma
Polgono de Percentagem
Polgono de Percentagem Acumulada
Organizando Dados Categricos:
tabela resumida
Uma tabela resumida ou distribuio de uma varivel nos diz:
- os valores assumidos por uma varivel; e
- a frequncia (percentual ou absoluta) com que a varivel os assume.
Como voc vai passar as
festas de final de ano?
Frequncia
Absoluta
Em casa com a famlia 90
Viajando para visitar a
famlia
76
Turismo 10
Colocando o trabalho
em dia
10
Outros 14
Total 200
Como voc vai passar as
festas de final de ano?
Percentual
Em casa com a famlia 45%
Viajando para visitar a
famlia
38%
Turismo 5%
Colocando o trabalho em
dia
5%
Outros 7%
Total 100%
Organizando Dados Categricos:
tabela resumida
Exerccio: 20 alunos selecionados aleatoriamente de uma turma de
Probabilidade e Estatstica indicaram a nfase que eles pretendem
seguir. As respostas esto listadas abaixo. Construa uma tabela
resumida para estes dados.
Cap 2-11
Comp Mec Comp Amb Amb
Comp Mec Mec Comp Telecom
Amb Mec Comp Comp Mec
Neuro Mec Comp Amb Mec
Organizando Dados Categricos:
tabela resumida
Soluo:
Cap 2-12
nfase Frequncia
absoluta
Frequncia
relativa
Ambiental 4 0.2
Computao 7 0.35
Mecnica 7 0.35
Neurocincias 1 0.05
Telecomunicaes 1 0.05
Organizando Dados Categricos:
grfico de barras
Em um grfico de barras, uma barra ilustra cada uma das
categorias, cujo comprimento representa a quantidade, a
frequncia ou o percentual de valores que se posicionam em
uma determinada categoria.
45%
38%
5%
5%
7%
0% 10% 20% 30% 40% 50%
Em casa com a familia
Viajando para visitar afamilia
Turismo
Colocando o trabalhoem dia
Outras
Como voc vai passar as festas de final de ano?
Cap 2-13
Organizando Dados Categricos:
o grfico de pizza
O grfico de pizza um crculo dividido em fatias que
representam as categorias. O tamanho de cada fatia varia de
acordo com a categoria.
Cap 2-14
Dicas
grfico de pizza:
Enfatizar a relevncia de uma categoria em relao ao
total.
Se as categorias no somam 100%, criar categoria extra
para o restante.
Grfico de barras:
Pode comparar qualquer conjunto de quantidades
medidas na mesma unidade.
Mostrar categorias em ordem decrescente (ou crescente)
ajuda a comparao visual entre categorias.
Cap 2-15
Organizando Dados Categricos:
o diagrama de Pareto
Um grfico de barras cujas categorias so
apresentadas em ordem decrescente de frequncia
+
Um polgono acumulado representado no mesmo
grfico
Usado para separar:
poucos vitais (poucas categorias muito importantes)
de
muitos triviais (demais categorias com menor
importncia)
Cap 2-16
Organizando Dados Categricos:
o diagrama de Pareto
Cap 2-17
Exemplo: A tabela resumida abaixo lista os diferentes defeitos em um
certo produto. Identifique os principais defeitos usando um diagrama
de Pareto.
Defeito Freqncia Pontos negros 413
Avarias 1039
Manchas 258
Marcas de pino 834
Arranhes 442
Marcas de moldagem 275
Riscos 413
Marcas de afundamento 371
Marcas de tinta 292
Deformidades 1987
Total 6324
Organizando Dados Categricos:
o diagrama de Pareto
Cap 2-18
Exemplo: O diagrama de Pareto contm um grfico de barras com
alturas decrescentes e um grfico de percentagem acumulada:
Defeito Freqncia Percentagem % Acumulada
Deformidades 1987 31% 31%
Avarias 1039 16% 47%
Marcas de pino 834 13% 60%
Pontos negros 413 7% 67%
Riscos 413 7% 81%
Marcas de afundamento 371 6% 87%
Marcas de tinta 292 5% 92%
Manchas 258 4% 96%
Marcas de moldagem 275 4% 100%
Total 6324 100%
Organizando Dados Categricos:
o diagrama de Pareto
Cap 2-19
Exemplo: O diagrama de Pareto contm um grfico de barras com
alturas decrescentes e um grfico de percentagem acumulada:
Defeito Freqncia Percentagem
Deformidades 1987 31%
Avarias 1039 16%
Marcas de pino 834 13%
Arranhes 442 7%
Pontos negros 413 7%
Riscos 413 7%
Marcas de afundamento 371 6%
Marcas de tinta 292 5%
Marcas de moldagem 275 4%
Manchas 258 4%
Total 6324 100%
Organizando Dados Categricos:
o diagrama de Pareto
Defeito Freqncia Percentagem
Pontos negros 413 7%
Avarias 1039 16%
Manchas 258 4%
Marcas de pino 834 13%
Arranhes 442 7%
Marcas de moldagem 275 4%
Riscos 413 7%
Marcas de afundamento 371 6%
Marcas de tinta 292 5%
Deformidades 1987 31%
Total 6324 100%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0%
5%
10%
15%
20%
25%
30%
35%
Defeito
Diagrama de Pareto
Cap 2-20
Percentagem % Acumulada
Organizando Dados Categricos:
tabela resumida
Exerccio: 20 alunos selecionados aleatoriamente de uma turma de
Probabilidade e Estatstica indicaram a nfase que eles pretendem
seguir. Os dados so apresentados na tabela resumida abaixo.
Construa um diagrama de Pareto para estes dados.
Cap 2-21
nfase Freq. Percentual
Ambiental 4 0.2
Computao 7 0.35
Mecnica 7 0.35
Neurocincias 1 0.05
Telecomunicaes 1 0.05
Cap 2-22
Tipos de Grficos e Tabelas
Dados
Categricos
Tabela Resumida
Grfico de Pizza
Grfico de Barras
Diagrama de Pareto
Numricos
Rol Disposio
Ramo-e-Folha
Distribuio de
Frequncia Histograma
Polgono de Percentagem
Polgono de Percentagem Acumulada
Organizando Dados Numricos:
Rol
Um rol uma sequncia de dados ordenados de forma
crescente ou descrescente.
Pesquisa com
idade de
estudantes
universitrios
Turma diurna
16 17 17 18 18 18
19 19 20 20 21 22
22 25 27 32 38 42
Turma noturna
18 18 19 19 20 21
23 28 32 33 39 52
Cap 2-23
Organizando Dados numricos:
disposio ramo-e-folha
Uma disposio ramo-e-folha organiza dados em grupos
(chamados de ramos ou caules) de tal modo que os valores em
cada grupo (as folhas) se ramifiquem para a direita de cada linha.
Cap 2-24
Ramo Folha
1 67788899
2 0012257
3 28
4 2
Organizando Dados numricos:
disposio ramo-e-folha
Para construir um diagrama ramo-e-folha:
1) separe cada observao (nmero) em:
Um ramo: composto de todos os dgitos menos o final; e
Uma folha: composta pelo dgito final.
2) Escreva os ramos em uma coluna vertical (do menor para
o maior) sem pular nenhum nmero
3) Escreva cada folha direita do ramo correspondente.
Cap 2-25
Organizando Dados numricos:
disposio ramo-e-folha
Exemplo: Construa um diagrama ramo-e-folha para a idade dos
estudandes universitrios da turma diurna:
16, 17, 17, 18, 18, 19, 19, 20, 20, 21, 22, 22, 25, 27, 32, 38, 42
Ramo Folha
1 67788899
2 0012257
3 28
4 2
Turma Diurna
Cap 2-26
Organizando Dados numricos:
disposio ramo-e-folha
Exerccio: Construa um diagrama ramo-e-folha para a idade dos
estudandes universitrios da turma noturna e compare com o da
turma diurna.
18, 18, 19, 19, 20, 21, 23, 28, 32, 33, 39, 52
Ramo Folha
1 67788899
2 0012257
3 28
4 2
Turma Diurna Turma Noturna
Ramo Folha
1 8899
2 0138
3 23
4
5 2
Cap 2-27
Cap 2-28
Tipos de Grficos e Tabelas
Dados
Categricos
Tabela Resumida
Grfico de Pizza
Grfico de Barras
Diagrama de Pareto
Numricos
Rol Disposio
Ramo-e-Folha
Distribuio de
Frequncia Histograma
Polgono de Percentagem
Polgono de Percentagem Acumulada
E se o nmero de dados na base for muito grande?? Ramo-e-folhas no
conveniente...
Organizando Dados Numricos:
distribuio de frequncia
A distribuio de frequncia uma tabela resumida na qual os dados so dispostos em grupos de classe ordenados numericamente.
Ateno para selecionar o nmero apropriado de grupos de classe para a tabela: escolher a amplitude adequada para cada grupo de classe e os limites de cada grupo de classe, evitando sobreposies.
Para determinar a amplitude de um intervalo de classe:
=
Cap 2-29
Organizando Dados Numricos:
distribuio de frequncia
Exemplo: Um fabricante de isolante trmico selecionou
aleatoriamente 20 dias no inverno e registrou a
temperatura mxima do dia (em F)
24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Cap 2-30
Para ter uma ideia melhor de como variam as temperaturas mximas,
vamos construir uma tabela com distribuio de frequncia dos
dados! Que classes vamos usar?
Organizando Dados Numricos:
distribuio de frequncia
Reorganizar os dados em ordem crescente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Encontrar a amplitude: 58 - 12 = 46
Escolher o nmero de grupos: 5 (geralmente entre 5 e 15)
Calcular o intervalo de classe (amplitude): 10 (aprox. 46/5)
Determinar os limites das classes: 10, 20, 30, 40, 50, 60
Contar observaes e designar a classes
Cap 2-31
Organizando Dados Numricos:
distribuio de frequncia
Classe Frequncia
[10,20) 3 0.15 15
[20,30) 6 0.30 30
[30,40) 5 0.25 25
[40,50) 4 0.20 20
[50,60) 2 0.10 10
Total 20 1.00 100
Frequncia
Relativa Percentagem (%)
Cap 2-32
Organizando Dados Numricos:
Histograma
Um grfico com a distribuio de frequncia de dados chamado de histograma.
Os limites de classe (ou pontos mdios de classes) so mostrados no eixo horizontal.
O eixo vertical representa a frequncia, frequncia relativa ou percentagem.
Barras de tamanho apropriado so usadas para representar o nmero de observaes em cada classe.
Cap 2-33
Organizando Dados Numricos:
Histograma
Classe Frequncia
[10, 20) 3 .15 15
[20, 30) 6 .30 30
[30, 40) 5 .25 25
[40, 50) 4 .20 20
[50, 60] 2 .10 10
Total 20 1.00 100
Frequncia
Relativa Percentagem
0
2
4
6
8
5 15 25 35 45 55 More
Fre
qu
n
cia
Histograma: Temperatura Diaria
Temperatura Maxima Diaria (F)
Cap 2-34
Mais
Os retngulos do histograma so
"colados" para indicar que a
varivel original contnua!
Organizando Dados Numricos:
Histograma
Quando for analisar um histograma observe:
Um padro geral: forma, centro e disperso dos dados
Valores atpicos: valor individual que est fora do padro geral.
Quantas classes usar?
A definio de classes pode alterar bastante o histograma. Ver: applet One variable Statistical Calculator do Moore.
Os programas computacionais escolhem automaticamente usando frmula de sturges. Mas, se voc quiser, sempre pode escolher as classes.
Cap 2-35
Organizando Dados Numricos:
polgono de percentagem
Um polgono de percentagem formado fazendo-
se com que o ponto mdio de cada classe represente
os dados naquela classe e, depois, interligando-se a
sequncia de pontos mdios em suas respectivas
percentagens de classe.
Um polgono de percentagens acumuladas
(Ogivas) exibe a varivel de interesse ao longo do
eixo X e a percentagem acumulada ao longo do eixo
Y.
Cap 2-36
Organizando Dados Numricos:
polgono de percentagem
0
2
4
6
8
5 15 25 35 45 55 More
Fre
qu
n
cia
Poligono de Percentagens: Maxima
Temperatura Diaria
Classe Frequncia
[10, 20) 3 .15 15
[20, 30) 6 .30 30
[30, 40) 5 .25 25
[40, 50) 4 .20 20
[50, 60] 2 .10 10
Total 20 1.00 100
Frequncia
Relativa Percentagem
(Em um polgono de
percentagens o eixo
vertical mostra a
percentagem de todas as
observaes por classe)
Temperatura Maxima Diaria (F)
Cap 2-37
Organizando Dados Numricos:
polgono de percentagem
acumulada
0
20
40
60
80
100
10 20 30 40 50 60
Pe
rce
nta
gem
A
cu
mu
lad
a
Ogiva: Maxima Temperatura Diaria
Classe Limite inferior % Menor do que o
Limite inferior
[10,20) 10 0
[20,30) 20 15
[30,40) 30 45
[40,50) 40 70
[50,60) 50 90
60 100
Temperatura Maxima Diaria (F)
Cap 2-38
Cap 2-39
Grficos e Tabelas para Duas
Variveis
Duas Variveis
Categricas
Tabela de Contingncia
Grficos de barras
paralelas
Numricas
Grficos de Disperso
Grficos Temporiaas
At agora analisamos apenas uma varivel separadamente. E se
quisermos analisar a relao entre duas variveis?
Tabulaes Cruzadas:
tabela de contingncia
Uma tabela de contingncia apresenta os resultados de duas variveis categricas. As respostas combinadas so classificadas de tal modo que as categorias de uma varivel fiquem localizadas nas linhas enquanto as categorias da outra varivel ficam localizadas nas colunas.
Os valores localizados nas interseces de linhas e colunas so chamados de clulas. Clulas podem conter:
Frequncias absolutas
Percentagens
Percentagens por linha ou por coluna.
Cap 2-40
Tabulaes Cruzadas:
tabela de contingncia
Exemplo: Uma pesquisa foi realizada para determinar a importncia de uma marca para consumidores em comparao a anos anteriores. Os resultados por gnero so apresentados abaixo:
Quais so as variveis? Quais so as categorias de cada varivel? Cap 2-41
Sexo
Importncia
da marca
Masculino Feminino Total
Maior 450 300 750
Menor ou igual 3300 3450 6750
Total 3750 3750 7500
Tabulaes Cruzadas:
grfico de barras paralelas
Cap 2-42
Grficos de Disperso
Grficos de Disperso so usados examinar possveis relaes entre duas variveis numricas.
Uma varivel medida no eixo vertical e a outra no eixo horizontal.
Cap 2-43
Grfico de Disperso
Volume
por dia
Custo
por dia
23 125
26 140
29 146
33 160
38 167
42 170
50 188
55 195
60 200
Cap 2-44
Sries Temporais
Um grfico de sries temporais usado para
estudar padres nos valores de uma varivel
numrica ao longo do tempo. Cada valor inserido
no grfico como um ponto de duas dimenses com o
perodo de tempo no eixo X e a varivel de interesse
no eixo Y.
Cap 2-45
Exemplo de Sries Temporais
Cap 2-46
Nmero de pessoas (em milhes) que visitaram um parque de
diverses nos EUA de 2000 a 2005.
Ano Nmero de pessoas
2000 317
2001 319
2002 324
2003 322
2004 328
2005 335
Represente graficamente a evoluo do nmero de visitantes ao parque
de diverses nos anos indicados.
Exemplo de Sries Temporais
Cap 2-47
Princpios de Grficos
O grfico no deve distorcer os dados.
O grfico no deve conter adornos desnecessrios
(tambm conhecidos como sucata de grficos).
A escala do eixo vertical deve sempre comear no zero
(ou indicar o corte).
Todos os eixos devem ser nomeados.
Um grfico deve conter um ttulo.
O grfico mais simples possvel deve ser utilizado para
um dado conjunto de dados.
Cap 2-48
Erros Grficos: Sucatas
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80
Salrio Mnimo
M apresentao
Salrio Mnimo
0
2
4
1960 1970 1980 1990
$
Boa apresentao
Cap 2-49
Erros Grficos:
Eixo Vertical Comprimido
Boa apresentao
Vendas Trimestrais Vendas Trimestrais
M apresentao
0
25
50
T1 T2 T3 T4
$
0
100
200
T1 T2 T3 T4
$
Cap 2-50
Erros Grficos: Eixo vertical
no possui zero
Vendas Mensais
36
39
42
45
J F M A M J
$
Grfico para vendas no primeiro semestre
Vendas Mensais
0
39
42
45
J F M A M J
$
36
Boa Apresentao M Apresentao
Cap 2-51
Resumo
Como organizar dados categricos usando tabela resumida, grfico de barras, grfico de pizza e o digrama de Pareto.
Como organizar dados numricos usando rol, diagrama ramo-e-folhas, distribuio de frequncias, histograma, polgono de frequncia e ogiva.
Como examinar tabulaes cruzadas usando tabela de contigncia e grficos de barras paralelas.
Nesta parte, nos vimos:
Cap 2-52
Resumo
Como utilizar grfico de disperso e grfico de sries temporais.
O que fazer e o que no fazer para ter grficos com boa apresentao.
Nesta parte, nos vimos:
Cap 2-53
Perguntas recapitulativas
1. Quais so as vantagens e desvantagens relativas a
utilizao de um grfico de barras, um grfico de pizza
e um diagrama de Pareto?
2. Compare um grfico de barras para dados categricos
e um histograma para dados numricos.
3. Qual a diferena entre um grfico de disperso e um
grfico de sries de tempo?
4. Aponte alguns erros clssicos de m utilizao de
grficos.
Cap 2-54