3.4. Representação de dados qualitativos em tabelas e · PDF...

Post on 04-Feb-2018

221 views 6 download

Transcript of 3.4. Representação de dados qualitativos em tabelas e · PDF...

3.4. Representação de dados qualitativos em tabelas e gráficos

Para a representação de dados qualitativos em tabelas e gráficos

vamos precisar definir algumas quantidades:

n = tamanho da amostra ou frequência absoluta total;

k = número de categorias ou classes;

ni = frequência absoluta da i-ésima categoria ou classe, i = 1, 2, ...,

k;

nnk

ii

1

fi = frequência relativa da i-ésima categoria ou classe, i = 1, 2, ..., k;

n

nf ii , tal que: 1

11

k

i

ik

ii

n

nf

3.4.1. Tabelas de frequências de variáveis qualitativas

Representação das frequências das categorias da variável

qualitativa numa tabela com as frequências absolutas e relativas.

Categorias Freq. absolutas Freq. relativas

Categoria 1 n1 f1 = n1 / n

⁞ ⁞ ⁞

Categoria i ni fi = ni / n

⁞ ⁞ ⁞

Categoria k nk fk = nk / n

Totais n 1

Exemplo 1: Causas mais comuns de intoxicação e envenenamento

em crianças de 1 a 5 anos.

Tabela 1: Causas mais comuns de intoxicação e envenenamento em

crianças de 1 a 5 anos.

Causas

(categorias)

Valores

Absolutos

Valores

Relativos

Medicamentos 152 0.380

Produtos Domésticos 49 0.123

Produtos Químicos 45 0.113

Animais Peçonhentos 34 0.085

Pesticidas Domésticos 26 0.065

Plantas 23 0.058

Outros 71 0.178

Total 400 1.00 Fonte: Adaptado do livro Bioestatística, Arango, H.G.

A tabela pode, ainda, ser representada com os valores relativos

e/ou as respectivas porcentagens:

Tabela 2: Causas mais comuns de intoxicação e envenenamento em

crianças de 1 a 5 anos (valores percentuais).

Causas

(categorias)

Valores

Absolutos

Valores

Relativos

Valores

Percentuais

Medicamentos 152 0.380 38.00

Produtos Domésticos 49 0.123 12.25

Produtos Químicos 45 0.113 11.25

Animais Peçonhentos 34 0.085 8.50

Pesticidas Domésticos 26 0.065 6.50

Plantas 23 0.058 5.75

Outros 71 0.178 17.75

Total 400 1.00 100.00 Fonte: Adaptado do livro Bioestatística, Arango, H.G.

Exemplo 2: Número de declarações de imposto de renda por pessoa

física no ano de 2012.

Tabela 3: Declarações de imposto de renda em 2012 por faixas de renda.

Faixas de renda Valores absolutos Valores relativos

Até 5 mil reais 10.578.893 0.4130

De 5 a 50 mil reais 4.986.451 0.1946

De 50 a 100 mil reais 2.690.803 0.1050

De 100 a 300 mil reais 4.255.263 0.1661

De 300 a 500 mil reais 1.336.082 0.0522

De 500 a 1000 mil reais 1.061.113 0.0414

Acima 1500 mil reais 708.948 0.0277

Totais 25.617.553 1.0000 Fonte: Receita Federal - http://www.receita.fazenda.gov.br

A tabela pode, ainda, ser representada com os valores relativos em

porcentagens:

Tabela 4: Declarações de imposto de renda em 2012 por faixas de renda

(valores percentuais).

Faixas de renda Valores

absolutos

Valores

relativos

Valores

percentuais

Até 5 mil reais 10.578.893 0.4130 41.30

De 5 a 50 mil reais 4.986.451 0.1946 19.46

De 50 a 100 mil reais 2.690.803 0.1050 10.50

De 100 a 300 mil reais 4.255.263 0.1661 16.61

De 300 a 500 mil reais 1.336.082 0.0522 5.22

De 500 a 1000 mil reais 1.061.113 0.0414 4.14

Acima 1500 mil reais 708.948 0.0277 2.77

Totais 25.617.553 1.0000 100.00 Fonte: Receita Federal - http://www.receita.fazenda.gov.br

Obs: Existe uma norma especifica do IBGE para a construção de

tabelas que pode ser observada.

3.4.2. Representação gráfica de variáveis qualitativas

A representação gráfica de variáveis qualitativas é feita

basicamente de gráficos de barras (ou colunas) ou gráficos de

setores (pizza), com suas diversas variações. Podem, também, ser

utilizados gráficos pictóricos, que, na prática são variações dos

gráficos de barras.

A seguir são apresentados os gráficos de barras e setores para as

Tabelas 1 e 2.

I) Gráfico de barras verticais ou colunas:

Gráficos do exemplo 1: Causas comuns de intoxicação e

envenenamento em crianças de 1 a 5 anos.

a) Gráfico de barras verticais ou colunas:

Figura 1: Causas mais comuns de intoxicação e envenenamento em

crianças de 1 a 5, anos em valores absolutos.

Figura 2: Causas mais comuns de intoxicação e envenenamento em

crianças de 1 a 5, anos em valores percentuais.

b) Gráfico de barras horizontais:

Figura 3: Causas mais comuns de intoxicação e envenenamento em

crianças de 1 a 5, anos em valores absolutos.

Gráficos do exemplo 2: Número de declarações do IRPF por faixas

de renda (2012).

a) Gráfico de barras verticais ou colunas:

Figura 4: Número de declarações de IRPF (mil unidades), por

faixas de renda, ano base 2012.

b) Gráfico de barras horizontais:

Figura 5: Número de declarações de IRPF, em valores percentuais,

por faixas de renda, ano base 2012.

II) Gráfico de setores (pizza):

Figura 6: Gráfico de setores (pizza) para causas mais frequentes de

intoxicação e envenenamento em crianças de 1 a 5, anos

em valores percentuais.

Variação: gráfico de pizza 3D

Figura 7: Gráfico de setores (pizza) 3D para causas mais frequentes de

intoxicação e envenenamento em crianças de 1 a 5.

Variação do gráfico de pizza, o gráfico de rosca

Figura 8: Gráfico tipo rosca para causas mais frequentes de intoxicação

e envenenamento em crianças de 1 a 5, anos em valores

percentuais.

3.4.3. Representações gráfica: o que se deve evitar:

a) Barras (ou colunas) muito afinadas e compridas:

Figura 9: Origem dos alunos da turma de Bioestatística

por distância, em km.

b) Barras (ou colunas) muito largas e baixas, com cores

distintas:

Figura 10: Origem dos alunos da turma de Bioestatística

por distância, em km.

c) Gráfico muito pequeno num espaço grande:

Figura 11: Origem dos alunos da turma de Bioestatística

por distância, em km.

d) Gráfico muito grande para o espaço:

Figura 12: Origem dos alunos da turma de Bioestatística

por distância, em km.

e) Gráfico fora de escala (propositalmente):

Tabela 5: Intenção de votos

Candidato Votos (%)

Candidato A 29.5

Candidato B 26.3

Candidato C 25.2

Candidato D 19.0

Total Geral 100

Figura 13: Intenção de votos para os 4 candidatos

Figura 14: Intenção de votos para os 4 candidatos

Figura 15: Intenção de votos para os 4 candidatos, lado a lado.

f) Gráfico muito muitas categorias:

Figura 13: Cidade de origem dos alunos de Bioestatística.

g) Interpretação equivocada:

Os limites atuais da distribuição de renda e riqueza no Brasil

Os 0,9% mais ricos do País detêm entre 59,9% e 68,5% da riqueza, sendo as principais

fontes de acumulação de riqueza os fluxos de renda e heranças. (Blog Carta Maior,

16/12/2014 )

Tabela 6: Distribuição de bens e direitos - 2006 e 2012.

Figura 14: Repartição da riqueza no Brasil pertencente aos percentuais

da população - 20121.

1 Fonte: http://idg.receita.fazenda.gov.br/dados/receitadata/estudos-e-tributarios-e-aduaneiros/trabalhos-academicos/trabalhos-academicos-pagina

3.5. Variáveis qualitativas em tabelas com dupla classificação

Muitas vezes as variáveis são apresentadas em tabelas com duas

classificações, conforme esquema.

Tabela 7: Tabela de dupla entrada l c: medalhas em Pequim 2008.

Continente Classificação A: Medalha Totais

das linhas Ouro Prata Bronze

América Latina1 3 12 10 25

América do Norte 93 79 46 218

África e Oceania 15 12 21 48

Ásia 32 24 34 90

Europa 83 92 132 307

Totais das colunas 226 219 243 688

1 América Latina = América do Sul, Central e México.

A Classificação A tem c = 3 categorias (colunas da tabela).

A Classificação B tem l = 5 categorias (linhas da tabela).

A tabela assim constituída pode ser identificada como:

tabela de dupla entrada (tabela l c );

tabela cruzada ou

tabela de contingência.

A tabela acima é uma tabela 53.

Cla

ssif

icaç

ão B

3.5.1. Caso especial l = c = 2, tabelas 22.

Tabela 8: Representação de uma tabela de dupla entrada 22.

A1 A2 Totais das linhas

B1 n11 n12 Total da linha 1

B2 n21 n22 Total da linha 2

Totais das

colunas

Total da

coluna 1

Total da

coluna 2

n

Exemplo 3: Crianças expostas à violência doméstica do pai contra a

mãe, variáveis situação civil da mãe e grupo (tabela 22).

Tabela 9: Tabela com dupla classificação segundo

situação civil da mãe por grupo.

Vive com o

companheiro Separada Totais

Expostos 11 4 15

Não Expostos 14 1 15

Totais 25 5 30

Assim temos:

n11 = 11 n12 = 4 n21 =14 n22 =1

Total da linha 1 = 15

Total da linha 2 = 15

Total da coluna 1 = 25

Total da coluna 2 = 5

Total geral: n = 30

Representação gráfica de uma tabela 22:

Figura 15: Representação gráfica da dupla classificação

situação civil da mãe por grupo.

3.5.2. Caso especial, tabelas em porcentagens.

A tabela de dupla classificação pode, ainda, ser construída levando

em consideração os percentuais em relação às colunas. Desta

forma, no exemplo acima teremos:

Tabela 10: Tabela situação civil da mãe por grupo,

em valores percentuais

Vive com o

companheiro (%)

Separada (%) Totais

Expostos 44 80 50

Não Expostos 56 20 50

Totais 100 100 100

Neste caso, a representação gráfica deve acompanhar a ordem de

grandeza.

Figura 16: Representação gráfica da situação civil da mãe

por grupo, em valores percentuais

Obs: quando se tem uma tabela com dupla classificação para se

comparar diferentes perfis é prudente que essa comparação

seja realizada considerando-se os valores percentuais.

Exemplo 4: Condições clínicas do periodonto de pacientes

atendidos na Clínica de Graduação da Faculdade de Odontologia

de Araraquara - UNESP, no período de 1994 a 1999 (tabela 43).

Tabela 11: Presença de doença por idade (anos).

Presença de

Doença

Faixa etária do paciente (anos)

Contagens Porcentagens

19-40 41-60 60 ou + 19-40 41-60 60 ou +

Diabete 11 11 3 30.6 17.7 15.8

Hipertensão 10 34 11 27.8 54.8 57.9

Discr. Sanguineas 5 1 3 13.9 1.6 15.8

Alt. Hormonais 10 16 2 27.8 25.8 10.5

Total 36 62 19 100.0 100.0 100.0

Idade x Presença de Doença

30.6

17.715.8

27.8

13.9

1.6

15.8

27.8 25.8

10.5

57.954.8

0

16

32

48

64

19-40 anos 41-60 anos 60 anos ou+

%

Diabete Hipetensão Discr.Sanguineas Alt.Hormonais

Figura 17: Faixa etária do paciente por Presença de doença.

Exemplo 5: Distribuição das medalhas das Olimpíadas de Pequim

(2008) segundo os continentes (tabela 53).

Tabela 12: Medalhas em Pequim 2008.

Continente Medalha Totais

das linhas Ouro Prata Bronze

América Latina1 3 12 10 25

América do Norte 93 79 46 218

África e Oceania 15 12 21 48

Ásia 32 24 34 90

Europa 83 92 132 307

Totais das colunas 226 219 243 688

1 América Latina = América do Sul, Central e México.

Figura 18: Medalhas nas olimpíadas de Pequim (2008).