apostila_estatistica

76
ESTATÍSTICA DESCRITIVA

Transcript of apostila_estatistica

Page 1: apostila_estatistica

ESTATÍSTICA

DESCRITIVA

Page 2: apostila_estatistica

APRESENTAÇÃO

O objetivo deste material é servir de apoio à disciplina de estatística. Ele foi estruturado demodo a cobrir todo o programa do curso, servido de suporte teórico e prático para o aluno.Esperamos que este material seja de total aproveitamento pelo aluno, servido aos propósitos desua elaboração.

Page 3: apostila_estatistica

3

SUMÁRIO

CAPÍTULO 1 - INTRODUÇÂO ............................................................................................................. 51.1 . Definições .......................................................................................................................................................................51.2 . Ramos Básicos da Estatística ..........................................................................................................................................51.3 . Tipos de Variáveis ..........................................................................................................................................................5

CAPÍTULO 2 – APRESENTAÇÃO DOS DADOS ............................................................................... 62.1 . Dados brutos ...................................................................................................................................................................62.2 . Rol...................................................................................................................................................................................62.3 . Distribuição de Freqüência Simples (variável discreta).................................................................................................72.4 . Distribuição de freqüência para dados agrupados em classes (variável contínua) .........................................................8

2.4.1 . Elementos de uma distribuição de freqüência para dados agrupados em classes....................................................82.4.1.1 . Freqüência Simples Absoluta ............................................................................................................................82.4.1.2 . Amplitude Total................................................................................................................................................82.4.1.3 . Limites de Classe ..............................................................................................................................................92.4.1.4 . Amplitude do Intervalo de Classe......................................................................................................................92.4.1.5 . Ponto Médio.......................................................................................................................................................9

2.4.2 . –Elaboração da tabela de freqüência para dados agrupados em classes :................................................................92.5 . –Tipos de Freqüência ....................................................................................................................................................11

2.5.1 . Freqüência Simples Absoluta................................................................................................................................12

2.5.2 . Freqüência Simples Relativa ii

ffrN

⎛ ⎞=⎜ ⎟⎝ ⎠

..........................................................................................................12

2.5.3 . Freqüência Acumulada..........................................................................................................................................122.5.4 . Freqüência Acumulada Relativa ..........................................................................................................................13

2.6 . Representação Gráfica ..................................................................................................................................................132.6.1 . Histograma ............................................................................................................................................................14

2.7 . Exercícios......................................................................................................................................................................142.8- Resposta dos exercícios 4 a 13 ......................................................................................................................................22

CAPÍTULO 3 - MEDIDAS TENDÊNCIA CENTRAL....................................................................... 233.1 . A Média Aritmética ......................................................................................................................................................23

3.1.1 – Média Aritmética Simples....................................................................................................................................233.1.2 . Média Aritmética Ponderada................................................................................................................................24

Exercício 1 ............................................................................................................................................................................253.2 . Média Aritmética para dados agrupados em classes .....................................................................................................263.3 . Propriedades da Média Aritmética................................................................................................................................28Exercício 2 ............................................................................................................................................................................293.4 . MEDIANA....................................................................................................................................................................31

3.4.1 . Mediana para dados brutos ou rol .........................................................................................................................313.4.2 . Mediana para dados agrupados em freqüência simples.........................................................................................333.4.3 . Mediana para dados agrupados em classes ...........................................................................................................34

Exercício 3 ............................................................................................................................................................................383.5 . MODA ..........................................................................................................................................................................39

3.5.1 . Moda para dados brutos ou rol ..............................................................................................................................393.5.2 . Moda para dados agrupados em freqüência ..........................................................................................................393.5.3 . Moda para dados agrupados em classe..................................................................................................................40

3.5.3.1 . Moda de Pearson..............................................................................................................................................403.5.3.2 . Moda de King ..................................................................................................................................................413.5.3.3 . Moda de Czuber...............................................................................................................................................41

Exercício 4 ............................................................................................................................................................................463.6 . Resposta dos exercícios do capítulo..............................................................................................................................47Exercício 1: ...........................................................................................................................................................................47Exercício 2: ...........................................................................................................................................................................47Exercício 3: ...........................................................................................................................................................................47Exercício 4: ...........................................................................................................................................................................48

APÊNDICE.............................................................................................................................................. 49

Page 4: apostila_estatistica

4

Cálculo das médias Geométrica e Harmônica.......................................................................................................................49Média Geométrica.................................................................................................................................................................49

Média Geométrica Simples ..............................................................................................................................................49Média Geométrica ponderada ..........................................................................................................................................49

Média Harmônica..................................................................................................................................................................50Média Harmônica Simples ...............................................................................................................................................50Média Harmônica Ponderada...........................................................................................................................................51

Exercícios..............................................................................................................................................................................51Resposta dos exercícios do apêndice ....................................................................................................................................52

CAPÍTULO 4 - SEPARATRIZES......................................................................................................... 534.1 . Introdução .....................................................................................................................................................................534.2 . Quartil ...........................................................................................................................................................................534.3 . Decil..............................................................................................................................................................................534.4 . Percentil ........................................................................................................................................................................544.5 . Cálculo de Separatrizes.................................................................................................................................................54

4.5.1 . Dados brutos ou Rol..............................................................................................................................................544.5.2 . Dados agrupados em freqüência simples ..............................................................................................................554.5.3 . Dados agrupados em classe...................................................................................................................................56

Exercícios..............................................................................................................................................................................584.6 . Resposta dos exercícios ................................................................................................................................................59

CAPÍTULO 5 – MEDIDAS DE DISPERSÃO ..................................................................................... 605.1 . Introdução .....................................................................................................................................................................605.2 . Amplitude Total ............................................................................................................................................................60

5.2.1 . Dados brutos ou rol ...............................................................................................................................................615.2.2 . Dados agrupados em freqüência simples ..............................................................................................................615.2.3 . Dados agrupados em classes .................................................................................................................................61

5.3 . Desvio Médio Simples ( )DMS ..................................................................................................................................625.3.1 . Dados brutos ou rol ...............................................................................................................................................625.3.2 . Dados agrupados em freqüência simples ..............................................................................................................635.3.3 . Dados agrupados em classes .................................................................................................................................64

5.4 . Variância e Desvio Padrão............................................................................................................................................655.4.1 . Dados brutos ou rol ...............................................................................................................................................655.4.2 . Dados agrupados em freqüência simples ..............................................................................................................665.4.3 . Dados agrupados em classes .................................................................................................................................67

5.5 . Interpretação do Desvio Padrão ....................................................................................................................................69Exercício 1 ............................................................................................................................................................................715.6 . Coeficiente de Variação ................................................................................................................................................72Exercício 2 ............................................................................................................................................................................725.7 . Resposta dos exercícios ................................................................................................................................................75Exercício 1 ............................................................................................................................................................................75Exercício 2 ............................................................................................................................................................................75

Page 5: apostila_estatistica

5

CAPÍTULO 1 - INTRODUÇÂO

1.1 . Definições

Estatística: É a ciência que cuida da coleta, da organização, da apresentação e da análise de dados.

Os dados consistem em informações provenientes de observações, contagens, medições ou respostas.

A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, namedida em que não nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatísticaextrair informação dos dados para obter uma melhor compreensão das situações que representam.

A estatística é considerada Ciência no sentido do estudo de uma população. É considerada como método quandoutilizada como instrumento por outra ciência.

Existem dois tipos de conjuntos de dados usados na estatística. Tais conjuntos são chamados de população eamostra.

População: É a totalidade do conjunto que se deseja estudar.

Exemplo:População dos alunos matriculados na Universidade.População dos residentes no estado do Rio de Janeiro.

Amostra: É um subconjunto, não vazio, do conjunto que se pretende estudar (população). A amostra representativaé um retrato fidedigno da população. Ela preserva as características da população.

Amostragem: É o processo de formação de amostras. Existem vários processos de amostragem. O processo deamostragem pode ser feito com ou sem reposição de elementos.

Parâmetro: é uma característica numérica estabelecida para toda uma população.

Estimador: é uma característica numérica estabelecida para uma amostra.

1.2 . Ramos Básicos da Estatística

Descritiva (ou dedutiva): Cuida basicamente da descrição de dados observados, sem estabelecimento de testes dehipóteses sobre o conjunto estudado.

Inferência (ou indutiva): É o ramo da estatística no qual, através do estudo de informações da amostra, sãodefinidas e testadas hipóteses acerca da população estudada, através do cálculo de probabilidades.

1.3 . Tipos de Variáveis

Discreta: variável quantitativa cujos possíveis valores formam um conjunto finito ou enumerável de números e quegeralmente resultam de uma contagem, como por exemplo o número de filhos.

Contínua: variável cujos possíveis valores formam um intervalo de números reais e que resultam, normalmente, deuma mensuração, como por exemplo peso, altura e pressão arterial.

Page 6: apostila_estatistica

6

CAPÍTULO 2 – APRESENTAÇÃO DOS DADOS

2.1 . Dados brutos

Normalmente, na prática, os dados originais de uma série estatística não se encontram prontos para análise, por

estarem desorganizados. Por essa razão, costuma-se chamá-los de dados brutos. Tomemos como exemplo o quadro

1 abaixo, que contém as notas obtidas em uma prova de estatística por 60 alunos de uma sala de aula de uma certa

faculdade.

Quadro 1:

7 3 4 5 4 4 4 5 4 4 5 8

5 6 9 5 3 6 6 8 4 4 4 4

4 5 7 6 3 6 7 8 6 4 5 5

6 6 8 4 3 7 3 5 5 5 8 8

5 6 2 9 7 6 6 6 4 6 4 8

Como podemos observar, as notas estão dispostas de forma desordenada. Em razão disso, pouca informação se

consegue obter, até mesmo uma simples nota mínima e máxima requer um certo exame de todos os dados.

Assim, dado bruto é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de

um fenômeno coletivo.

2.2 . Rol

É uma lista ordenada dos dados brutos de uma série estatística. Essa ordenação pode ser crescente ou decrescente.

Utilizando o exemplo das notas de estatística. e ordenando as notas, vem:

Quadro 2:

2 3 3 3 3 3 4 4 4 4 4 4

4 4 4 4 4 4 4 4 4 5 5 5

5 5 5 5 5 5 5 5 5 6 6 6

6 6 6 6 6 6 6 6 6 6 7 7

7 7 7 8 8 8 8 8 8 8 9 9

Page 7: apostila_estatistica

7

2.3 . Distribuição de Freqüência Simples (variável discreta)

Em geral, o trabalho estatístico envolve uma grande massa de dados. Desta forma, a estatística descritiva opera de

modo a reduzir a quantidade de dados com os quais se vai trabalhar diretamente. Isto se torna possível modificando-

se a forma de apresentação dos dados.

Tomemos como exemplo as notas de estatística do quadro 2. Se entendermos como freqüência simples ( )if de

um elemento o número de vezes que este elemento figura no conjunto de dados, podemos reduzir significativamente

o número de elementos com os quais se vai trabalhar.

O resultado desta reorganização dos dados é chamado de Distribuição de Freqüência, e esta apresentado na tabela

1 abaixo.

Assim, uma distribuição de freqüência é uma representação tabular de um conjunto de valores em que colocamos na

1ª. coluna, em ordem crescente, apenas os valores distintos da série e na 2ª. coluna os valores das freqüências

simples correspondentes.

TABELA AUXILIAR TABELA 1

Grausobtidos

Contagem outabulação

Númerode

alunos1 0 0

2 1 0

3 2 1

4 3 5

5 4 15

6 5 12

7 6 13

8 7 5

9 8 7

10 9 2

11 10 0

total 60

Este tipo de apresentação é mais empregada quando o número de elementos distintos da série for pequeno.

Graus Obtidos Número dealunos

0 0

1 0

2 1

3 5

4 15

5 12

6 13

7 5

8 7

9 2

10 0

total 60

Page 8: apostila_estatistica

8

2.4 . Distribuição de freqüência para dados agrupados em classes (variável contínua)

Quando o número de elementos distintos de uma série for grande, devemos optar por agruparmos os dados emintervalos de classes. A tabela 2 abaixo apresenta um exemplo de dados agrupados em classes e suas respectivasfreqüências simples.

TABELA 2

Classe de Idades Freqüência ( )if

0 |⎯⎯ 10 5

210 |⎯⎯ 0 15

320 |⎯⎯ 0 20

430 |⎯⎯ 0 45

540 |⎯⎯ 0 100

Total 185

OBS.: O símbolo ( )|⎯⎯ significa fechado à esquerda (contém o valor) e aberto à direita (não contém o valor).

Cada uma das classes de idades apresentadas na tabela 2 ( ) , 1 2 , etc.0 |⎯⎯ 10 0 |⎯⎯ 0 é denominada de

Intervalo de Classe.

2.4.1 . Elementos de uma distribuição de freqüência para dados agrupados em classes

2.4.1.1 . Freqüência Simples AbsolutaA freqüência simples ( )if de uma classe ou de um valor é o número de observações correspondentes a essa classe

ou a esse valor. Na tabela 2:

1 2 3 4 55; 15; 20; 45 e 100 f f f f f= = = = =

2.4.1.2 . Amplitude TotalA amplitude total ( )At é a diferença entre o maior e o menor valor observado da variável. Sendo máxX o maior

elemento da seqüência e mínX o menor, temos: máx mínAt X X= − . Nos dados das notas da tabela 1 temos:

9 2 7At = − = , onde 9 é o maior valor observado e 2 o menor. Para as 185 pessoas agrupadas na tabela 2, se

tivéssemos uma idade mínima de 2 anos e uma idade máxima de 48 anos, a amplitude total dos dados seria:

48 2 46 At anos= − =

Page 9: apostila_estatistica

9

Entretanto, ao trabalharmos com uma massa muito grande de informações agrupadas em intervalos de classes,

calculamos a amplitude total como a diferença entre o ponto médio (veja definição a seguir) da última e da primeira

classes.

2.4.1.3 . Limites de Classe São os valores extremos de cada intervalo de classe. O menor valor da classe é denominado limite inferior ( )il e o

maior valor de limite superior ( )iL . Na tabela 2 temos:

4l é 30. (limite inferior da 4a. classe)

4L é 40. (limite superior da 4a. classe)

2.4.1.4 . Amplitude do Intervalo de ClasseA amplitude do intervalo de classe ( )ih é a diferença entre os limites superior e inferior da classe: i i ih L l= − .

Na tabela 2, a amplitude do intervalo de classe é constante e igual a 10.

10 - 0 = 20 - 10 = 30 - 20 = 40 - 30 = 50 - 40 = 10As classes não precisam necessariamente ter a mesma amplitude conforme nosso exemplo. Porém, sempre que

possível devemos trabalhar com classes de mesma amplitude. Isto facilita os cálculos posteriores.

2.4.1.5 . Ponto MédioO ponto médio ( )ix de uma classe é o valor representativo da classe. Para obter o ponto médio de uma classe,

basta somar os limites superior e inferior da classe e dividir por 2:

2i i

il Lx +

=

Na tabela 2 temos: 10 10 5

2x +

= = 210 20 15

2x +

= = 320 30 25

2x +

= =

430 40 35

2x +

= = 540 50 45

2x +

= =

2.4.2 . –Elaboração da tabela de freqüência para dados agrupados em classes :

O número de classes a ser utilizado em uma distribuição de freqüência depende muito da experiência do pesquisador

e das questões que ele pretende responder com a variável contínua. De modo geral, utiliza-se um mínimo de cinco e

um máximo de 20 classes. Um dos métodos para se determinar o número de classes de uma distribuição é o critério

da raiz, o qual será descrito a seguir:

Se a seqüência estatística estudada contém n elementos e se indicarmos por K o número de classes a ser utilizado

então, pelo critério de raiz: K n= .

Page 10: apostila_estatistica

10

Como K deve ser necessariamente um número inteiro e como dificilmente n é um número inteiro, utilizamos

para o valor de K o inteiro mais próximo de 1n ± .

A amplitude do intervalo de classe ( )h é determinada da seguinte forma: AthK

= .

Outra forma de determinarmos o número K é empregando a fórmula de Sturges: 1 3,3logK n= + .

Para valores de n muito grandes, esta fórmula apresenta mais vantagens que o critério da raiz, embora apresente o

mesmo problema de aproximação do valor de K .

Exemplo. Abaixo apresentamos a seqüência de valores referentes ao resultado de um teste de QI aplicado em

determinada classe de alunos de uma faculdade.

111 90 121 105 122 61 128 112 128 93

108 138 88 110 112 112 97 128 102 125

87 119 104 116 96 114 107 113 80 113

123 95 115 70 115 101 114 127 92 103

78 118 100 115 116 98 119 72 125 109

79 139 75 109 123 124 108 125 116 83

94 106 117 82 122 99 124 84 91 130

Inicialmente, verificamos que a série possui 70 elementos. Pelo critério da raiz K n= . No nosso exemplo,

70 8,37K = = . O valor inteiro mais próximo é 8. Portanto, temos opção para construir a variável contínua

com 7, 8 ou 9 classes.

O maior valor da seqüência é 139máxX = e o menor valor da seqüência é 61mínX = . Assim, a amplitude total

da seqüência é 139 61 78At = − = .

No entanto, sabemos que pelo fato de o critério adotado do intervalo de classe ser semi-aberto à direita, devemos

ajustar o valor máxX . Se o ajustássemos para 140, a amplitude ajustada passaria a ser 140 61 79At = − = . Este

valor não é divisível, de forma inteira, por 7, 8 ou 9, que são as opções de classes.

Nesta situação devemos ajustar máxX para 141 obtendo a 141 61 80At = − = que é divisível exatamente por 8,

obtendo-se uma amplitude de intervalo de classe h dada por: 80 108

AthK

= = = .

Observe que o ajuste do valor de máxX foi de duas unidades, passando de 139 para 141.

A experiência do pesquisador, nesta situação, o levaria a distribuir este erro de duas unidades, iniciando a

representação da série em 60 e terminando em 140. A amplitude total ajustada para a série é de

140 60 80At = − = .

Page 11: apostila_estatistica

11

A amplitude do intervalo de classe é 10h = e o número de classes é 8K = .

Computando as freqüências simples de cada classe, construímos a variável contínua representativa desta série.

Classe Intervalo de Classe if

1 760 |⎯⎯ 0 1

2 870 |⎯⎯ 0 5

3 980 |⎯⎯ 0 6

4 1090 |⎯⎯ 0 10

5 11100 |⎯⎯ 0 12

6 12110 |⎯⎯ 0 19

7 13120 |⎯⎯ 0 14

8 14130 |⎯⎯ 0 3

Total 70

Pela fórmula de Sturges 1 3,3log 70 7,088K = + =

2.5 . –Tipos de Freqüência

Uma vez que os dados sendo estudados já tenham sido colocados na forma de uma distribuição de freqüência,

algumas informações adicionais e úteis podem ser facilmente obtidas. Além da freqüência simples absoluta, já

citada anteriormente, outros tipos de freqüência podem ser extraídos da distribuição, conforme apresentado no

esquema abaixo:

( )( )

Absoluta Freqüência Simples

Relativa i

i

f

fr

⎧⎪⎨⎪⎩

( )( )

( )( )

Absoluta Abaixo de

Relativa

(crescente)Freqüência Acumulada

Absoluta Acima de

Relativa

(decrescente)

i

i

i

i

F

Fr

F

Fr

⎧ ⎧⎪⎪ ⎨⎪ ⎪⎩⎪⎪⎪⎨⎪ ⎧⎪⎪ ⎨⎪ ⎪⎩⎪⎪⎩

Page 12: apostila_estatistica

12

2.5.1 . Freqüência Simples Absoluta

Conforme visto anteriormente, é o número de observações correspondentes a uma classe ou a um valor.

A soma das freqüências simples absolutas é chamada de freqüência total, simbolizada por if N=∑ .

A partir daqui, toda vez que nos referirmos a freqüência de uma classe, estamos tratando da freqüência simples

absoluta.

2.5.2 . Freqüência Simples Relativa ii

ffrN

⎛ ⎞=⎜ ⎟⎝ ⎠

É o quociente entre a freqüência de determinada classe (ou valor) e a freqüência total.

ii

ffrN

⎛ ⎞=⎜ ⎟⎝ ⎠

ou ii

i

ffrf

⎛ ⎞=⎜ ⎟⎜ ⎟

⎝ ⎠∑

Desejando-se expressar o resultado em termos percentuais, multiplica-se o quociente obtido por 100.

( )% 100ii

ffrN

= ⋅

A soma das freqüências relativas é sempre igual a 1 ou 100%.

Exemplo:

Idades if ifr

0 |⎯⎯ 10 5 5 0,0270 ou 2,70%185 =

210 |⎯⎯ 0 15 15 0,0811 ou 8,11%185 =

320 |⎯⎯ 0 20 20 0,1081 ou 10,81%185 =

430 |⎯⎯ 0 45 45 0,2432 ou 24,32%185 =

540 |⎯⎯ 0 100 100 0,5406 ou 54,06%185 =

Total 185 1 ou 100%

2.5.3 . Freqüência Acumulada

Existem 2 tipos de freqüência acumulada, Abaixo de (ab) e Acima de (ac).

A freqüência acumulada Abaixo de uma classe ou de um valor é a soma das freqüências anteriores até a classe ou

valor, inclusive.

A freqüência acumulada Acima de uma classe ou de um valor é a soma das freqüências posteriores, além da classe

ou valor, inclusive.

Exemplo:

Page 13: apostila_estatistica

13

Idades if ( )iF ab ( )iF ac

0 |⎯⎯ 10 5 5 185

210 |⎯⎯ 0 15 20 180

320 |⎯⎯ 0 20 40 165

430 |⎯⎯ 0 45 85 145

540 |⎯⎯ 0 100 185 100

Total 185 - -

2.5.4 . Freqüência Acumulada Relativa

Da mesma forma que a acumulada absoluta, a acumulada relativa pode ser Abaixo de ou Acima de. Porém, ao

invés de acumular a freqüência absoluta, acumula-se a freqüência relativa, ou simplesmente divide-se cada valor

acumulado pela freqüência total.

Exemplo:

Idades if ( )iF ab ( ) %

iFr ab ( )iF ac ( ) %

iFr ac

0 |⎯⎯ 10 5 5 2,70 185 100

210 |⎯⎯ 0 15 20 10,81 180 97,30

320 |⎯⎯ 0 20 40 21,62 165 89,19

430 |⎯⎯ 0 45 85 45,94 145 78,38

540 |⎯⎯ 0 100 185 100 100 54,06

Total 185 - - - -

2.6 . Representação Gráfica

Existem muitas formas de se representar graficamente uma série estatística. No entanto, a maioria são gráficos de

apresentação. Nosso interesse está voltado para os gráficos de análise de séries estatísticas que são o Histograma e o

Polígono de Freqüência. Estes gráficos, por vezes, facilitam a identificação de padrões em um conjunto de dados

analisado.

Page 14: apostila_estatistica

14

2.6.1 . Histograma

O histograma é um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Este

gráfico é elaborado em um sistema de coordenadas cartesianas onde, no eixo das abscissas (horizontal) são

colocados os valores dos dados (ou suas classes), e no eixo das ordenadas (vertical) as respectivas freqüências.

Exemplo: Seja a seguinte série de dados e seu respectivo histograma:

Para uma distribuição de freqüência em classes, o histograma seria:

Faltas if

0 |⎯⎯ 2 3

42 |⎯⎯ 6

64 |⎯⎯ 8

86 |⎯⎯ 5

108 |⎯⎯ 2

2.7 . Exercícios

ix if

2 1

3 4

5 8

6 6

7 2

Page 15: apostila_estatistica

15

1) O Instituto Z realizou, em uma determinada Escola Municipal, pesquisas relacionadas ao desenvolvimento da

estatura de crianças e o meio sócio-econômico em que habitam.

A pesquisa foi feita com 80 crianças, numa faixa etária de 6 a 8 anos, sendo catalogadas, para estudo estatístico,

as seguintes estaturas apresentadas na tabela abaixo. Complete as colunas vazias com as informações

aprendidas.

Estatura

(cm) if %ifr ( )iF ab ( ) %

iFr ab ( )iF ac ( ) %

iFr ac

125 |⎯⎯ 130 10

135130 |⎯⎯ 15

14135 |⎯⎯ 0 25

145140 |⎯⎯ 10

15145 |⎯⎯ 0 15

155150 |⎯⎯ 5

Total 80 - - -

2) Abaixo encontra-se a distribuição de classes dos pesos dos alunos de educação física de uma escola do 2° grau,

que irão participar de um torneio olímpico. Complete a tabela.

Pesos

(Kg) if %ifr ( )iF ab ( ) %

iFr ab ( )iF ac ( ) %

iFr ac

45 |⎯⎯ 50 5

5550 |⎯⎯ 6

655 |⎯⎯ 0 11

6560 |⎯⎯ 13

765 |⎯⎯ 0 7

7570 |⎯⎯ 8

Total 50 - - -

Page 16: apostila_estatistica

16

3) Através das médias finais de estatística de 90 alunos, construiu-se uma tabela de distribuição de freqüências.

Complete as colunas faltantes.

Notas if %ifr ( )iF ab ( ) %

iFr ab ( )iF ac ( ) %

iFr ac

51 |⎯⎯ 58 2

6558 |⎯⎯ 6

7265 |⎯⎯ 14

7972 |⎯⎯ 29

8679 |⎯⎯ 23

9386 |⎯⎯ 11

10093 |⎯⎯ 5

Total 90 - - -

4) Uma indústria, interessada em verificar o total de horas-extras trabalhadas pelos seus técnicos na área de

produção, fez um levantamento dos dados, encontrando a seguinte distribuição:

Horas if %ifr iF %iFr

10 |⎯⎯ 17 18

2417 |⎯⎯ 16

3124 |⎯⎯ 24

3831 |⎯⎯ 31

4538 |⎯⎯ 26

5245 |⎯⎯ 28

Page 17: apostila_estatistica

17

Total 143 - -

Complete a tabela e responda:

a) Quantos técnicos fizeram horas-extras abaixo de 24 horas no mês anterior?

b) Qual a percentagem de técnicos que fizeram horas-extras no mês anterior igual ou superior a 38 horas?

c) Qual a porcentagem de técnicos que fizeram horas-extras no mês anterior entre 31 e 38 horas?

d) Quantos técnicos fizeram horas-extras no mês anterior entre 17 horas e 45 horas?

5) Uma fábrica, com um total de 150 operários, verificou um alto índice de faltas nos últimos 6 meses. O gerente,

preocupado com esta situação, fez um levantamento verificando a seguinte distribuição:

Faltas if %ifr iF %iFr

0 |⎯⎯ 2 60

42 |⎯⎯ 30

64 |⎯⎯ 30

86 |⎯⎯ 15

108 |⎯⎯ 15

Total 150 - -

Complete a tabela e responda:

a) Quantos operários tiveram nos últimos 6 meses menos de 6 faltas?

b) Qual a porcentagem de operários com número de faltas igual ou superior a 6?

c) Qual a porcentagem de operários que tiveram entre 6 e 8 faltas?

d) Qual a porcentagem de operários que tiveram entre 2 e 8 faltas?

6) Uma indústria de autopeças estava interessada em estabelecer uma gratificação aos operários que mais se

destacassem no setor da produção. Para isto, fez um levantamento sobre a produção homem/hora, encontrando

os seguintes dados:

Peças if %ifr iF %iFr

1260 |⎯⎯ 1292 12

13241292 |⎯⎯ 7

13561324 |⎯⎯ 14

13881356 |⎯⎯ 7

Page 18: apostila_estatistica

18

14201388 |⎯⎯ 18

14521420 |⎯⎯ 42

Total 100 - -

Complete a tabela e responda:

a) Quantos operários produziram abaixo de 1356 peças?

b) Qual a porcentagem de operários cuja produção ficou entre 1324 e 1356 peças?

c) Qual a porcentagem de operários cuja produção foi igual ou superior a 1356 peças?

d) Quantos operários tiveram produção entre 1292 e 1420 peças?

7) Interessado em fazer uma reavaliação dos vencimentos de seus funcionários, o dono de uma empresa listou todos

os salários, encontrando os seguintes dados:

Sal. mínimo if %ifr iF %iFr

0 |⎯⎯ 2 37

42 |⎯⎯ 22

64 |⎯⎯ 10

86 |⎯⎯ 6

108 |⎯⎯ 5

Total 80 - -

Complete a tabela e responda:

a) Quantos funcionários ganham abaixo de 6 S. M?

b) Qual a proporção de funcionários com salários iguais ou acima de 4 S. M?

c) Qual a porcentagem de funcionários com salários entre 2 e 8 S. M?

d) Qual a porcentagem de funcionários com salários abaixo de 8 S. M?

e) Quantos funcionários ganham entre 6 e 10 S. M?

8) O Setor de controle de Qualidade de uma indústria de peças de televisão estava interessado em verificar o tempode duração de seu produto. Para isto, selecionou uma amostra de 100 peças, e testou a duração em número dehoras, encontrando a seguinte distribuição em centenas de horas:

Centenas de horas if %ifr iF %iFr

360 |⎯⎯ 452 8

544452 |⎯⎯ 6

Page 19: apostila_estatistica

19

636544 |⎯⎯ 9

728636 |⎯⎯ 17

820728 |⎯⎯ 23

912820 |⎯⎯ 17

1004912 |⎯⎯ 20

Total 100 - -

Complete a tabela e responda:

a) Quantas peças tiveram duração abaixo de 636 centenas de horas?

b) Qual a proporção de peças que tiveram duração igual ou superior a 728 centenas de horas?

c) Qual a porcentagem de peças que tiveram duração entre 636 e 728 centenas de horas?

d) Quantas peças tiveram duração entre 544 e 820 centenas de horas?

9) Um certo fabricante de cabos de aço estava interessado em verificar a carga máxima suportada pelos cabos

produzidos pela sua fábrica. Para tal, selecionou uma amostra de 50 cabos de aço, encontrando a seguinte

distribuição dos pesos em toneladas:

Toneladas if %ifr iF %iFr

9,3 |⎯⎯ 9,9 4

10,59,9 |⎯⎯ 8

11,110,5 |⎯⎯ 18

11,711,1 |⎯⎯ 12

12,311,7 |⎯⎯ 8

Total 50 - -

Complete a tabela e responda:

a) Quantos cabos de aço suportaram pesos de 10,5 toneladas?

b) Qual a porcentagem de cabos de aço que suportaram pesos iguais ou superiores a 11,1 toneladas?

c) Qual a porcentagem de cabos de aço que suportaram pesos entre 10,5 e 11,1 toneladas?

d) Quantos cabos de aço suportaram pesos entre 9,9 e 11,7 toneladas?

10) Interessado em incrementar o seu quadro de vendas, o diretor de uma indústria de eletrodomésticos apurou o

total de unidades vendidas no último mês, para cada vendedor, encontrando os seguintes resultados:

Page 20: apostila_estatistica

20

Unidades vendidas if %ifr iF %iFr

18 |⎯⎯ 24 5

3024 |⎯⎯ 6

3630 |⎯⎯ 8

4236 |⎯⎯ 14

4842 |⎯⎯ 6

5448 |⎯⎯ 8

6054 |⎯⎯ 3

Total 50 - -

Complete a tabela e responda:

a) Quantos vendedores tiveram no último mês, vendas abaixo de 42 unidades?

b) Qual a porcentagem de vendedores que no último mês venderam 36 unidades ou mais?

c) Qual a porcentagem de vendedores que no último mês venderam entre 36 e 42 unidades?

d) Quantos vendedores tiveram no último mês, vendas entre 30 e 54 unidades?

11) Um escritório de contabilidade, com um cadastro de 50 empresas do ramo imobiliário, resolveu fazer um

levantamento sobre o Capital Imobilizado nas empresas, encontrando a seguinte distribuição em centenas de

reais:

Centenas R$ if %ifr iF %iFr

400 |⎯⎯ 500 6

600500 |⎯⎯ 4

700600 |⎯⎯ 12

800700 |⎯⎯ 8

Page 21: apostila_estatistica

21

900800 |⎯⎯ 7

1000900 |⎯⎯ 13

Total 50 - -

Complete a tabela e responda:

a) Quantas empresas tem capital imobilizado abaixo de R$ 70.000,00?

b) Qual a porcentagem de empresas cujo capital imobilizado está entre R$ 60.000,00 e R$ 70.000,00?

c) Qual a porcentagem de empresas com capital imobilizado igual ou superior a R$ 70.000,00?

d) Qual a porcentagem de empresas com capital imobilizado entre R$ 50.000,00 e R$ 90.000,00?

12) O escritório de contabilidade mencionado anteriormente, verificando as despesas operacionais dessas 50

empresas no exercício do ano anterior, encontrou a seguinte distribuição (em centenas de reais)

Centenas R$ if %ifr iF %iFr

40 |⎯⎯ 43 7

4643 |⎯⎯ 9

4946 |⎯⎯ 8

5249 |⎯⎯ 7

5552 |⎯⎯ 9

5855 |⎯⎯ 10

Total 50 - -

Complete a tabela e responda:

a) Quantas empresas tiveram despesas operacionais abaixo de R$ 4.900,00?

b) Qual a porcentagem de empresas com despesas operacionais entre R$ 4.600,00 e R$ 4.900,00?

c) Qual a porcentagem de empresas com despesas operacionais iguais ou superiores a R$ 4.600,00?

d) Qual a porcentagem de empresas com despesas operacionais entre R$ 4.300,00 e R$ 5.500,00?

13) Um empresário, com 60 filiais de sua empresa distribuídas por todo país, chamou o seu Contador para que lhe

desse a situação do ativo imobilizado das filiais em 31 de dezembro do ano anterior. Através de contatos com os

gerentes, encontrou-se a seguinte distribuição:

Centenas R$ if %ifr iF %iFr

200 |⎯⎯ 260 14

Page 22: apostila_estatistica

22

320260 |⎯⎯ 12

380320 |⎯⎯ 14

440380 |⎯⎯ 9

500440 |⎯⎯ 11

Total 60 - -

Complete a tabela e responda:

a) Quantas filiais tiveram a posição do seu ativo imobilizado igual ou superior a R$ 32.000,00 na data?

b) Qual a proporção de filiais com ativo imobilizado inferior a R$ 44.000,00?

c) Qual a porcentagem de filiais com ativo imobilizado entre R$ 32.000,00 e R$ 38.000,00?

d) Qual a porcentagem de filiais com ativo imobilizado entre R$ 26.000,00 e R$ 44.000,00?

2.8- Resposta dos exercícios 4 a 13

a b c d e4 34 técnicos 37,7622% 21,6784% 97 técnicos5 120 operários 20% 10% 50%6 33 operários 14% 67% 46 operários7 69 funcionários 26,25% 47,5% 93,75% 11 funcionários8 23 peças 60% 17% 49 peças9 38 cabos 40% 36% 38 cabos

10 33 vendedores 62% 28% 36vendedores

11 22 empresas 24% 56% 62%12 24 empresas 16% 68% 66%13 34 filiais 81,6667% 23,3333% 58,3333%

Page 23: apostila_estatistica

23

CAPÍTULO 3 - MEDIDAS TENDÊNCIA CENTRAL

No estudo de uma série estatística é conveniente o cálculo de algumas medidas que a caracterizam.

Estas medidas, quando bem interpretadas, podem fornecer informações muito valiosas com respeito a série

estatística.

Em resumo, podemos reduzi-la a alguns valores, cuja interpretação fornece uma compreensão bastante precisa da

série.

As medidas de tendência central são alguns destes valores, as quais estão compreendidas entre o menor e o maior

valor da série. Uma medida de tendência central é também um valor em torno do qual os elementos da série estão

distribuídos e a posiciona em relação ao eixo horizontal.

Em suma, a medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série

se concentra.

As principais medidas de tendência central são: média, mediana e moda.

Do ponto de vista teórico, vários tipos de médias podem ser calculados para uma massa de dados. Em nosso estudo

focalizaremos a principal delas, a média aritmética. Ao final do capítulo falaremos sobre as médias geométrica e

harmônica.

3.1 . A Média Aritmética

A média aritmética é o ponto de equilíbrio de uma distribuição de dados, ou seja, é o ponto que representa todos os

dados da distribuição.

Apesar de a média aritmética ser uma medida muito utilizada na prática, deve-se tomar cuidado na sua aplicação,

uma vez que ela é bastante afetada pelos valores extremos da distribuição.

A média aritmética é representada por µ , quando se tratar de uma população, e x , quando se tratar de uma

amostra.

Conforme vimos no capítulo anterior, os dados representativos de uma série estatística podem ser apresentados sem

nenhuma ordenação (dados brutos), ordenados de forma crescente ou decrescente (rol), em uma distribuição de

freqüência simples (valor a valor), ou agrupados em classes. Independente da forma de apresentação, podemos

calcular a média dos dados segundo as formas a seguir

3.1.1 – Média Aritmética Simples

A média aritmética, ou média, de um conjunto de N números 1 2, , , nx x x é definido por:

1 2 in xx x xxN N

µ + + += = = ∑

Page 24: apostila_estatistica

24

A fórmula acima é utilizada quando temos dados brutos ou rol.

Exemplo

1) Determinar a média aritmética para as séries abaixo, obtidas de uma amostra:

a) { }1, 1, 3, 4, 4

1 1 3 4 4 13 2,65 5

x + + + += = =

b) { }0,2; 3,4; 4,1

0,2 3,4 4,1 7,7 2,56673 3

x + += = =

c) { }1 2 2 4, , , 2 3 5 5

1 2 2 415 20 12 242 3 5 5 0,5917

4 120x

+ + + + + += = =

2) A média mínima de aprovação em estatística é 5.0. Um estudante obtém as notas 8,5; 8,5; 9,0; 4,0; 4,0; 4,0; 0;

2,5 nos trabalhos mensais da disciplina. Determine se ele foi aprovado ou não.

8,5 8,5 9,0 4,0 4,0 4,0 0 2,5 40,5 5,068 8

µ + + + + + + += = =

Como a média do estudante foi 5,06, que é superior a média de aprovação (5,0), ele foi aprovado.

3.1.2 . Média Aritmética Ponderada

Se os valores 1 2, , , nx x x de uma distribuição são afetados por pesos (ou freqüências) 1 2, , , nf f f , então:

1 1 2 2

1 2

i in n

n i

x fx f x f x fxf f f f

µ + + += = =

+ + +∑∑

Empregamos esta fórmula no cálculo da média em dados apresentados sob a forma de distribuição de freqüência,

sendo os pesos de cada atributo suas freqüências. No caso dos dados agrupados em classes, as freqüências

empregadas no cálculo da média são os pontos médios de cada classe, conforme veremos a seguir.

Page 25: apostila_estatistica

25

Exemplo:

1) Em um exame de matemática, português e inglês, com pesos 3, 2 e 1 respectivamente, uma estudante obteve as

seguintes notas nas provas 60, 70 e 80 . Seu grau médio é:

3 60 2 70 1 80 180 140 80 400 66,676 6 6

µ ⋅ + ⋅ + ⋅ + += = = =

2) Determine a média final de um aluno que tirou 4 em português, 5 em matemática, 7 em geografia e 8 em história,

sabendo que os pesos das respectivas disciplinas são 2, 3, 1 e 1, respectivamente.

4 2 5 3 7 1 8 1 8 15 7 8 5,437 7

µ ⋅ + ⋅ + ⋅ + ⋅ + + += = =

3) Através de uma amostra realizou-se um levantamento das idades de 20 alunos, relacionados na tabela abaixo.

Determine a idade média.

18 2 20 7 22 5 25 6 36 140 110 150 436 21,8 22 anos20 20 20

x ⋅ + ⋅ + ⋅ + ⋅ + + += = = = ≈

Exercício 1

1) Calcular a média aritmética das séries abaixo:

a) 2, 3, 5, 6, 8

b) 10, 12, 15, 17, 22

c) 5, 8, 9, 10, 4, 3, 2

d) 4, 5, 7, 8, 10, 12, 14

ix (anos) if

18 2

20 7

22 5

25 6

Total 20

Page 26: apostila_estatistica

26

2) Calcular a média aritmética das séries abaixo:

a) 3, 2, 3, 2, 4, 4, 4, 5, 5, 5, 6

b) 1, 1, 1, 2, 2, 10, 10, 10

3) Calcule a média aritmética das distribuições abaixo:

a) b)

3.2 . Média Aritmética para dados agrupados em classes

Para dados agrupados em classes, utilizaremos a fórmula da média aritmética ponderada, considerando as

freqüências simples das classes como sendo as ponderações dos pontos médios destas classes. Assim, teremos:

i i

i

x fx

fµ = = ∑

Exemplo:

1) Determinar a média aritmética da distribuição mostrada abaixo:

Estatura

(cm) if ix i ix f

125 |⎯⎯ 130 10 127,5 1.275,0

135130 |⎯⎯ 15 132,5 1.987,5

14135 |⎯⎯ 0 25 137,5 3.437,5

145140 |⎯⎯ 10 142,5 1.425,0

15145 |⎯⎯ 0 15 147,5 2.212,5

155150 |⎯⎯ 5 152,5 762,5

Total 80 - 11.100

ix if

1 7

3 3

4 2

Total 12

ix if

2 4

4 2

5 1

Total 7

Page 27: apostila_estatistica

27

Altura média: 11.100 138,75

80i i

i

x fx cm

f= = =∑

∑Quando agrupamos os dados na disposição de uma variável contínua, passamos a trabalhar com os dados sem

conhecimento de seus valores individuais.

Note no exemplo acima, que o máximo que podemos afirmar com respeito ao menor valor desta série é que ele é um

valor maior ou igual a 125 e menor que 130. Mas não conhecemos seu valor individualizado.

O mesmo ocorre com todos os outro valores da série.

Este fato é que nos leva a substituir as classes pelos seus pontos médios ao calcular a média da série.

2) Determinee o peso médio referente aos dados da tabela abaixo:

Pesos

(Kg) if ix i ix f

45 |⎯⎯ 50 5 47,5 237,5

5550 |⎯⎯ 6 52,5 315,0

655 |⎯⎯ 0 11 57,5 632,5

6560 |⎯⎯ 13 62,5 812,5

765 |⎯⎯ 0 7 67,5 472,5

7570 |⎯⎯ 8 72,5 580,0

Total 50 - 3.050

Peso médio: 3.050 61

50i i

i

x fx Kg

f= = =∑

Page 28: apostila_estatistica

28

3) Determine a média aritmética da tabela de freqüência abaixo:

Notas if ix i ix f

51 |⎯⎯ 58 2 54,5 109,0

6558 |⎯⎯ 6 61,5 369,0

7265 |⎯⎯ 14 68,5 959,0

7972 |⎯⎯ 29 75,5 2.189,5

8679 |⎯⎯ 23 82,5 1.897,5

9386 |⎯⎯ 11 89,5 984,5

10093 |⎯⎯ 5 96,5 482,5

Total 90 - 6.991

Nota média: 6.991 77,67

90x = =

3.3 . Propriedades da Média Aritmética

a) A soma dos desvios de um conjunto de números em relação a média aritmética é zero.

( )1

0N

ii

x x=

− =∑ ou ( )1

0N

i ii

x x f=

− =∑

b) A soma dos quadrados dos desvios de um conjunto de números em relação a média é mínimo.

( ) ( )2 2

01 1

N N

i ii i

x x x x= =

− ⟨ −∑ ∑ ou ( ) ( )2 2

01 1

N N

i i i ii i

x x f x x f= =

− ⟨ −∑ ∑

onde 0x é um valor arbitrário qualquer, 0x x≠ .

c) Se 1n números tem média 1x , 2n números tem média 2x , ..., kn números tem média kx , a média do conjunto

formado por todos os números é dada pela expressão:

1 1 2 2 1

1 2

1

k

i ik k i

kk

ii

n xn x n x n xx

n n n n

=

=

+ + += =

+ + +

d) Se somarmos ou subtrairmos uma constante k a cada um dos elementos 1 2, , , nx x x de um conjunto, a

média ficará somada ou subtraída pela constante k .

Page 29: apostila_estatistica

29

e) Se multiplicarmos ou dividirmos cada elemento 1 2, , , nx x x de um conjunto por uma constante k , a média

ficará multiplicada ou dividida por esta constante.

Exercício 2

1) A média mínima de aprovação em Estatística é 5,0. Se um estudante obtém as notas 8,5; 9,0; 4,0; 4,0; 0 e 2,5 nos

trabalhos mensais da disciplina, ele foi aprovado ou reprovado? Caso o professor dê 1 ponto em cada nota, qual

seria a nova nota média?

2) As provas de Estatística tem os seguintes pesos 3, 2 e 1 respectivamente para a 1a, 2a e 3a. provas. Se um aluno

obteve 8 na 1a. prova, 6,5 na segunda e 0 na 3a. prova, e, sabendo-se que a média de aprovação é 5, verificar se este

aluno foi aprovado. Explique:

3) O salário médio de uma empresa é R$ 300,00. Se o dono da empresa der de gratificação natalina um abono de

R$ 50,00 no mês de dezembro, qual será o novo salário médio neste mês?

4) Uma determinada indústria, verificando que a sua produção triplicou devido ao esforço de seus operários,

resolveu duplicar os salários. Sabendo-se que o salário médio pago por essa indústria era de R$500,00, qual será o

novo salário médio?

5) Um determinado órgão público pagava, em média, a seus funcionários, a quantia de R$ 1.000,00 por mês. O

governo resolveu aumentar a alíquota de contribuição para a previdência de 10% para 15%. Qual será o novo

salário médio pago por esse órgão?

6) Calcule a média de horas-extras trabalhadas pelos técnicos no mês anterior, registradas na tabela do exercício 4

do capítulo 2, reproduzida abaixo.

Horas if ix i ix f

10 |⎯⎯ 17 18

2417 |⎯⎯ 16

3124 |⎯⎯ 24

3831 |⎯⎯ 31

4538 |⎯⎯ 26

5245 |⎯⎯ 28

Total 143 -

Page 30: apostila_estatistica

30

7) Calcule o número médio de faltas de 150 operários nos últimos 6 meses, registradas na tabela do exercício 5 do

capítulo 2, reproduzida abaixo.

Faltas if ix i ix f

0 |⎯⎯ 2 60

42 |⎯⎯ 30

64 |⎯⎯ 30

86 |⎯⎯ 15

108 |⎯⎯ 15

Total 150 -

8) Determine o número médio de peças produzidas por 100 operários no Setor de produção de uma fábrica,

registradas na Tabela do exercício 6 do capítulo 2, reproduzida abaixo.

Peças if ix i ix f

1260 |⎯⎯ 1292 12

13241292 |⎯⎯ 7

13561324 |⎯⎯ 14

13881356 |⎯⎯ 7

14201388 |⎯⎯ 18

14521420 |⎯⎯ 42

Total 100 -

9) Determine o salário médio de 80 funcionários de uma empresa, registradas na Tabela do exercício 7 do capítulo

2, reproduzida abaixo.

Sal. mínimo if ix i ix f

0 |⎯⎯ 2 37

42 |⎯⎯ 22

64 |⎯⎯ 10

86 |⎯⎯ 6

108 |⎯⎯ 5

Total 80 -

Page 31: apostila_estatistica

31

10) Calcule o tempo de duração médio de 100 peças de televisão produzidas por uma indústria, registradas na

Tabela do exercício 8 do capítulo 2, reproduzida abaixo.

Centenas de horas if ix i ix f

360 |⎯⎯ 452 8

544452 |⎯⎯ 6

636544 |⎯⎯ 9

728636 |⎯⎯ 17

820728 |⎯⎯ 23

912820 |⎯⎯ 17

1004912 |⎯⎯ 20

Total 100 -

11) Determine a carga média máxima suportada por cabos de aço produzidos por uma fábrica, cujos pesos estão

registradas na Tabela do exercício 9 do capítulo 2, reproduzida abaixo.

Toneladas if ix i ix f

9,3 |⎯⎯ 9,9 4

10,59,9 |⎯⎯ 8

11,110,5 |⎯⎯ 18

11,711,1 |⎯⎯ 12

12,311,7 |⎯⎯ 8

Total 50 -

3.4 . MEDIANA

A mediana ( )Md é um valor que separa uma distribuição em duas partes, deixando à sua esquerda o mesmo

número de elementos que à sua direita.

3.4.1 . Mediana para dados brutos ou rol

Para o cálculo da mediana deve-se, inicialmente, ordena os dados.

Page 32: apostila_estatistica

32

Quando a série de dados é constituída de um número ( )n ímpar de elementos, a mediana ocupa a posição

12

on +⎛ ⎞⎜ ⎟⎝ ⎠

.

Exemplo: O conjunto de números 1, 2, 3, 4, 4, 5, 6, 8, 9 tem como mediana:

9 1 5 (quinto elemento)2MdP +

= =

4Md =

Quando a série de dados é constituída de um número ( )n par de elementos tem-se 2 elementos centrais, que

ocupam as posições 2

on⎛ ⎞⎜ ⎟⎝ ⎠

e 12

on⎛ ⎞+⎜ ⎟⎝ ⎠

. A mediana é convencionada como sendo a média dos valores que ocupam

estas posições centrais. Cabe ressaltar que o valor da mediana pode não coincidir com os valores observados.

Exemplo: O conjunto de números 0, 1, 1, 3, 4, 5, 6, 7, 9, 9 tem mediana :

9 1 5 (quinto elemento) e2

10 1 6 (sexto elemento)2

MdP += =

= + =

4 5 4,52

Md += =

Observação: Para calcular a posição da mediana, independente do número de elementos da série (par ou ímpar),

calcula-se este como sendo 1

2MdnP +

= . Sendo n ímpar, obteremos diretamente em que posição na série se

encontra ao valor da mediana. Sendo n par, o valor da mediana será a média entre os elementos vizinhos aquele

apontado.

Exemplo: Sejam as séries de valores: : 2, 8, 12, 12, 20, 20, 23A e : 7, 8, 9, 10, 13, 13, 15, 21B .

Na série A temos 7n = elementos. A mediana ocupa a posição 1 7 1 4

2 2MdnP + +

= = = . Ou seja, a mediana é

o quarto elemento da série. Logo, 12Md = .

Ns série B temos 8n = elementos. A mediana ocupa a posição 1 8 1 4,5

2 2MdnP + +

= = = . Ou seja, a mediana

ocupa a posição 4,5, isto é, está situada entre o quarto e o quinto elemento da série. Logo,

10 13 23 11,52 2

Md += = = .

Page 33: apostila_estatistica

33

3.4.2 . Mediana para dados agrupados em freqüência simples

Para o cálculo da mediana de dados agrupados em freqüência (variável discreta), basta verificar se o número de

elementos da série é par ou ímpar e aplicar o mesmo raciocínio do caso anterior. De modo a facilitar a localização

dos termos centrais, devemos construir a freqüência acumulada da série.

Exemplo:

1)

115 82Md

nn P += ⇒ = =

Construindo a freqüência acumulada podemos localizar com facilidade o oitavo elemento da série.

Note que o elemento que ocupa a 1ª. posição na série é 20. Em seguida aparecem 5 elementos iguais a 22. Estes

elementos ocupam as posições de 2º a 6º elementos na série. Depois aparecem mais 9 elementos iguais a 25 que

ocupam na série as pocições de 7º a 15º elementos.

Conseqüentemente, o elemento que ocupa a 8ª posição vale 25, e podemos afirmar que a mediana é 25.

2)

1 1312 6,52 2Md

nn P += ⇒ = = =

A mediana está situada entre o 6º e o 7º elemento, e será a média aritmética destes dois valores.

1.000 1.000 1.0002

Md += =

ix

(anos)

if

(alunos)

iF

20 1 1

22 5 6

25 9 15

Total 15 -

ix

(salários)

if

(empregados)

iF

1.000,00 8 8

2.000,00 2 10

5.000,00 2 12

Total 12 -

Page 34: apostila_estatistica

34

3)

10 110 5,52Mdn P +

= ⇒ = =

A mediana está situada entre o 5º e o 6º elemento da série.

180 185 182,5 cm2

Md += =

3.4.3 . Mediana para dados agrupados em classes

Para o cálculo da mediana de dados agrupados em classes (variável contínua), o raciocínio anterior não pode ser

utilizado, uma vez que mesmo identificando a posição da mediana na série, o valor do elemento da série que ocupa

esta posição não é identificável. Utilizaremos um exemplo para generalizar a fórmula de cálculo da mediana.

Considere a seguinte distribuição de freqüência:

Classes if iF

3 |⎯⎯ 6 2 2

96 |⎯⎯ 5 7

129 |⎯⎯ 8 15

1512 |⎯⎯ 3 18

1815 |⎯⎯ 1 19

Total 19 -

O número de elementos da série é 19in f= =∑ .

A mediana, por definição, separa o número de elementos da série em dois grupos, contendo cada um deles 50% dos

elementos.

ix

(alturas)

if

(alunos)

iF

150 3 3

180 2 5

185 5 10

Total 10 -

Page 35: apostila_estatistica

35

Portanto, a posição da mediana na série é 2n

. No exemplo 19 9,52

oo⎛ ⎞ =⎜ ⎟

⎝ ⎠.

O valor decimal 9,5 indica que a mediana é um elemento posicionado entre o nono e o décimo elemento da série.

Observando a freqüência acumulada para identificar em qual classe estão situados o nono e o décimo elemento da

série, notamos que estes estão posicionados na terceira classe, o que indica que a median é um valor compreendido

entre 9 e 12. A classe que contém a mediana será identificada como classe mediana.

Este intervalo de três unidades contém 8 elementos. Supondo que eles estão uniformemente distribuídos neste

intervalo, então poderemeos dividir este intrevalo de modo proporcional à posição da mediana na série.

7ª 9,5a 15ª

|--------------------|--------------------|

9 x Md 12

Ou seja: 15 7 9,5 7

3 x− −

= . Simplificando: 8 9,5 7 9,5 7 33 8

xx− −

= ⇒ = ⋅

Portanto:

9Md x= +

9,5 79 38

Md −= + ⋅ 9,9375Md =

Observando na fórmula em destaque acima que:

• 9 é o limite inferior da classe mediana;

• 9,5 é a metade dos elementos da série, isto é, 2n ;

• 7 é a freqüência acumulada da classe anterior à classe mediana;

• 8 é a freqüência simples da classe mediana;

• 3 é a amplitude do intervalo de classe.

Podemos generalizar a fórmula de cálculo da mediana para variável contínua como:

2 i

ii

n F antMd l h

f md

−= + ⋅

Page 36: apostila_estatistica

36

Onde:

il = limite inferior da classe mediana

n = número de elementos da série

iF ant = freqüência acumulada da classe anterior à classe mediana

if md = freqüência simples da classe mediana

h = amplitude do intervalo de classe.

Observação: Devido às condições impostas na obtenção da fórmula da mediana, fica evidente que o valor obtido

por esta é um valor aproximado do verdadeiro valor da mediana da série.

De modo geral, todas as medidas calculadas para uma variável contínua serão valores aproximados para estas

medidas, uma vez que ao agruparmos os dados segundo uma variável contínua, há perda de informações quanto a

identidade dos dados.

Exemplo:

1) Determinar a mediana para as seguintes distribuições abaixo:

a)

Estatura

(cm) if iF

125 |⎯⎯ 130 10 10

135130 |⎯⎯ 15 25

14135 |⎯⎯ 0 25 50

145140 |⎯⎯ 10 60

15145 |⎯⎯ 0 15 75

155150 |⎯⎯ 5 80

Total 80 -

80 402 2

oMd

nP = = =

Observando a coluna das freqüências acumuladas, verificamos que a classe mediana é a terceira. Aplicando a

fórmula, a mediana é:

40 25 15135 5 135 5 135 3 13825 25

Md cm−= + ⋅ = + ⋅ = + =

Page 37: apostila_estatistica

37

b)

Pesos

(Kg) if iF

45 |⎯⎯ 50 5 5

5550 |⎯⎯ 6 11

655 |⎯⎯ 0 11 22

6560 |⎯⎯ 13 35

765 |⎯⎯ 0 7 42

7570 |⎯⎯ 8 50

Total 50 -

50 252 2

oMd

nP = = =

Observando a coluna das freqüências acumuladas, verificamos que a classe mediana é a quarta. Aplicando a

fórmula, a mediana é:

25 22 360 5 60 5 60 1,15 61,1513 13

Md Kg−= + ⋅ = + ⋅ = + =

c)

Notas if iF

51 |⎯⎯ 58 2 2

6558 |⎯⎯ 6 8

7265 |⎯⎯ 14 22

7972 |⎯⎯ 29 51

8679 |⎯⎯ 23 74

9386 |⎯⎯ 11 85

10093 |⎯⎯ 5 90

Total 90 -

90 452 2

oMd

nP = = =

Observando a coluna das freqüências acumuladas, verificamos que a classe mediana é a quarta. Aplicando a

fórmula, a mediana é:

Page 38: apostila_estatistica

38

45 22 2372 7 72 7 72 5,55 77,5529 29

Md −= + ⋅ = + ⋅ = + =

Exercício 3

1) Uma empresa possui três filiais, representadas pelas letras A, B, C. Através de um levantamento sobre as faltas

do último ano, verificou-se as seguintes distribuições:

A: 7, 5, 6, 1, 3, 8, 10

B: 10, 9, 1, 3, 0, 4, 6, 8

C: 0, 10, 1, 3, 9, 7, 6, 5, 8, 6

Determine o número de faltas considerada mediana para cada filial.

2) Determinar a mediana para as séries representadas nas tabelas abaixo:

a) b)

c)

3) Determinar o valor da mediana das distribuições apresentadas nos exercícios 4 a 9 do capítulo 2.

Alturas

(cm) if

160 5

175 2

180 3

Total 10

Idade if

20 7

25 2

28 6

Total 15

Reais if

150,00 3

180,00 10

285,00 5

Total 18

Page 39: apostila_estatistica

39

3.5 . MODA

A moda ( )Mo é o valor de maior freqüência em um conjunto de dados.

3.5.1 . Moda para dados brutos ou rol

Vamos identificar a moda para um rol, através dos seguintes exemplos:

1) X = 4, 5, 5, 6,6 6, 7, 7, 8, 8

O valor mais freqüente é 6. Portanto, 6Mo = . Esta é uma seqüência unimodal.

2) Y = 2, 3, 4, 5, 6

Como todos os elementos da série têm a mesma freqüência, não há um que se destaque pela maior freqüência.

Assim, diremos que a série é amodal, ou seja, não tem moda.

3) Z = 2, 4, 4, 4, 6, 7, 8, 8, 8, 9

Esta seqüência apresenta os elementos 4 e 8 como elementos de maior freqüência. Portanto, 4Mo = e 8Mo = .

Esta é uma seqüência bimodal.

3.5.2 . Moda para dados agrupados em freqüência

Nesta situação, como as freqüências já estão computadas na segunda coluna, a moda será o valor da variável

correspondente a maior freqüência da tabela.

Exemplo:

1)

Maior freqüência = 8 25 anosMo⇒ = ⇒ Unimodal

Idade if

20 2

22 4

25 8

Total 14

Page 40: apostila_estatistica

40

2)

Maior freqüência = 8 R$1.000,00 e R$5.000,00Mo⇒ = ⇒ Bimodal

3)

Maior freqüência = não há ⇒ Amodal

3.5.3 . Moda para dados agrupados em classe

Para determinar a moda de uma série de dados agrupados em classes, podemos optar por vários processos. Daremos

destaque para a moda de Pearson, a moda de King e a moda de Czuber.

3.5.3.1 . Moda de Pearson

A moda de uma variável contínua pode ser obtida através do valor da média e da mediana.

3 2Mo Md x= −Exemplo:

Classes if ix i ix f

0 |⎯⎯ 10 1 5 5

2010 |⎯⎯ 3 15 45

3020 |⎯⎯ 6 25 150

4030 |⎯⎯ 2 35 70

Total 12 - 270

Reais if

1.000,00 8

2.000,00 2

5.000,00 8

Total 18

Alturas

(cm) if

150 3

180 3

185 3

Total 9

Page 41: apostila_estatistica

41

270 22,512

i i

i

x fx

f= = =∑

6 42 20 10 23,336

i

ii

n F antMd l h

f md

− −= + ⋅ = + ⋅ =

( ) ( )3 2 3 23,33 2 22,5 25Mo Md x= − = − =

Note que a moda está situada na terceira classe que é a classe de maior freqüência da série. Esta é chamada de

classe modal.

3.5.3.2 . Moda de King

Esta fórmula leva em consideração a freqüência simples da classe anterior e a freqüência simples da classe posterior

à classe modal.

ii

i i

f postMo l hf ant f post

= + ⋅+

Onde:

il = limite inferior da classe modal

if post = freqüência simples da classe posterior à classe modal.

if ant = freqüência simples da classe anterior à classe modal.

h = amplitude do intervalo de classe.

Exemplo: Aplicando a fórmula de King aos dados do exercício anterior, temos:

A classe modal é a de maior freqüência, portanto é a terceira, e a moda vale:

220 10 243 2

Mo = + ⋅ =+

3.5.3.3 . Moda de Czuber

Nesta formulação, levou-se em consideração a freqüência simples da classe anterior, a freqüência simples da classe

posterior, além da freqüência simples da classe modal. É portanto, uma fórmula mais completa que a fórmula de

King.

( )2i i

ii i i

f mo f antMo l hf mo f ant f post

−= + ⋅

− +

Page 42: apostila_estatistica

42

Onde:

il = limite inferior da classe modal

if mo = freqüência simples da classe modal.

if ant = freqüência simples da classe anterior à classe modal.

if post = freqüência simples da classe posterior à classe modal.

h = amplitude do intervalo de classe.

Exemplo: Aplicando a fórmula de Czuber aos dados do exercício anterior, temos:

A classe modal é a de maior freqüência, portanto é a terceira, e a moda vale:

( ) ( )6 320 10 24, 29

2 6 3 2Mo −

= + ⋅ =− +

Observação: A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana

na distribuição, a fórmula de Pearson é a mais trabalhosa. Esta fórmula é mais adequada para distribuições

simétricas.

A fórmula de King é a mais simples delas, mas não a mais precisa.

A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a freqüência da

classe modal. Nos exemplos anteriores, o cálculo da moda pelos três processos determinou três valores diferentes.

É claro que os três valores obtidos são valores aproximados do verdadeiro valor da moda. Normalmente o mais

confiável é o valor da moda de Czuber.

Exemplos

1) Determine a moda da tabela de freqüência do exercício 1 do capítulo 2.

Estatura

(cm) if

125 |⎯⎯ 130 10

135130 |⎯⎯ 15

14135 |⎯⎯ 0 25

145140 |⎯⎯ 10

15145 |⎯⎯ 0 15

155150 |⎯⎯ 5

Total 80

Page 43: apostila_estatistica

43

Moda de Pearson: ( ) ( )3 2 3 138 2 138,75 136,5Mo Md x= − = − =

Moda de King: 10135 5 135 2 137

15 10i

ii i

f postMo l hf ant f post

= + ⋅ = + ⋅ = + =+ +

Moda de Czuber: ( ) ( )

25 15135 5 135 2 1372 2 25 15 10

i ii

i i i

f mo f antMo l hf mo f ant f post

− −= + ⋅ = + ⋅ = + =

− + ⋅ − +

2) Determine a moda da tabela de freqüência do exercício 2 do capítulo 2.

Pesos

(Kg) if

45 |⎯⎯ 50 5

5550 |⎯⎯ 6

655 |⎯⎯ 0 11

6560 |⎯⎯ 13

765 |⎯⎯ 0 7

7570 |⎯⎯ 8

Total 50

Moda de Pearson: ( ) ( )3 2 3 61,15 2 61 61, 45Mo Md x= − = − =

Moda de King: 760 5 60 1,94 61,94

11 7i

ii i

f postMo l hf ant f post

= + ⋅ = + ⋅ = + =+ +

Moda de Czuber: ( ) ( )

13 1160 5 60 1, 25 61, 252 2 13 11 7

i ii

i i i

f mo f antMo l hf mo f ant f post

− −= + ⋅ = + ⋅ = + =

− + ⋅ − +

Page 44: apostila_estatistica

44

3) Determine a moda da tabela de freqüência do exercício 3 do capítulo 2.

Notas if

51 |⎯⎯ 58 2

6558 |⎯⎯ 6

7265 |⎯⎯ 14

7972 |⎯⎯ 29

8679 |⎯⎯ 23

9386 |⎯⎯ 11

10093 |⎯⎯ 5

Total 90

Moda de Pearson: ( ) ( )3 2 3 77,55 2 77,67 77,31Mo Md x= − = − =

Moda de King: 2372 7 72 4,35 76,35

14 23i

ii i

f postMo l hf ant f post

= + ⋅ = + ⋅ = + =+ +

Moda de Czuber: ( ) ( )

29 1472 7 72 5 772 2 29 14 23

i ii

i i i

f mo f antMo l hf mo f ant f post

− −= + ⋅ = + ⋅ = + =

− + ⋅ − +

4) Determine a média , a mediana e a moda de Czuber para os dados da tabela a seguir.

Notas if iF ix i ix f

0 |⎯⎯ 10 5 5 5 25

2010 |⎯⎯ 15 20 15 225

3020 |⎯⎯ 20 40 25 500

4030 |⎯⎯ 45 85 35 1.575

5040 |⎯⎯ 100 185 45 4.500

6050 |⎯⎯ 130 315 55 7.150

7060 |⎯⎯ 100 415 65 6.500

8070 |⎯⎯ 60 475 75 4.500

9080 |⎯⎯ 15 490 85 1.275

10090 |⎯⎯ 10 500 95 950

Total 500 - - 27.200

Page 45: apostila_estatistica

45

27.200 54, 4500

i i

i

x fx

f= = =∑

250 1852 50 10 55130

i

ii

n F antMd l h

f md

− −= + ⋅ = + ⋅ =

( ) ( )130 10050 10 50 5 55

2 2 130 100 100i i

ii i i

f mo f antMo l hf mo f ant f post

− −= + ⋅ = + ⋅ = + =

− + ⋅ − +

Nota: Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente

precisamos de apenas uma das medidas para caracterizar o centro da série. Surge então a questão: qual medida

deve ser usada?

A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série.

Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda coincidirão com este valor

e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática.

Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem,

apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação ao valor da

média não serão bem representados por ela.

Dessa forma, se uma série apresenta forte concentração de dados em sua área central, a média , a mediana e a moda

ficam também situadas em sua área central representando bem a série, como na figura abaixo. Como a mais

conhecida é a média, optamos por esta medida de tendência central. Concluindo, devemos optar pela média,

quando houver forte concentração de dados na área central da série.

Se uma série apresenta forte concentração de dados em seu início (assimetria positiva), a mediana e a moda estarão

posicionadas mais no início da série, representando bem esta concentração. A média que é fortemente afetada por

alguns valores posicionados no final da série se deslocará para a direita desta concentração, não a representando

bem.

Como a mais conhecida entre mediana e moda é a mediana, esta será a medida indicada neste caso.

A mesma situação ocorre se a série apresenta forte concentração de dados em seu final (assimetria negativa).

Concluindo, devemos optar pela mediana, quando houver forte concentração de dados no início ou no final

da série.

x

Page 46: apostila_estatistica

46

A moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento

típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outro elementos da série.

Exercício 4

1) Determine a moda para os conjuntos abaixo:

a) 0, 0, 0, 1, 1, 3

b) 1, 1, 2, 2, 3, 3, 5, 5

c) 1 2 2 6, , , 2 3 10 9

2) A tabela abaixo representa o número de acertos em cada questão de uma prova de sete questões aplicada em

determinada turma. Determine a questão considerada mais fácil.

Questão if

1 2

2 6

3 14

4 29

5 23

6 11

7 35

Total 120

3) Determinar o valor da moda de Czuber das distribuições apresentadas nos exercícios 4 a 9 do capítulo 2.

Mo Md x MoMdx

Page 47: apostila_estatistica

47

3.6 . Resposta dos exercícios do capítulo

Exercício 1:

1 ) a) 4,8 b) 15,2 c) 5,8571 d) 8,5714

2) a) 3,9091 b) 4,625

3) a) 2 b) 3

Exercício 2:

1) µ = 4,67. Não foi aprovado devido a nota média ter sido inferior a 5. Ao conceder 1 ponto em cada nota, a média

do estudante passa a ser 5,67.

2) µ = 6,17. Foi aprovado devido a nota média ter sido superior a 5.

3) R$350,00

4) R$1.000,00

5) R$ 1.050,00

6) 33,13 horas

7) 3,6 faltas

8) 1.384,16 peças

9) 3 salários mínimos

10) 748,24 centenas de horas ou 74.824 horas

11) 10,94 toneladas

Exercício 3:

1) a) 6Md = b) 5Md = c) 6Md =

2) a) 167,5Md cm= b) 25Md anos= c) $180,00Md R=

3) 34,05 Md horas=

3 faltasMd =

1.405,78 peçasMd =

2, 27 SMMd =

768 centenas de horasMd =

10,93 toneladasMd =

Page 48: apostila_estatistica

48

Exercício 4:

1) a) 0 b) não há moda c) 23

2) sétima questão

3) 35,08 horasMo =

1,33 faltasMo =

1.431,64 peçashorasMo =

1, 42 S.M.Mo =

774 centenas de horasMo =

10,88 toneladasMo =

Page 49: apostila_estatistica

49

APÊNDICE

Cálculo das médias Geométrica e Harmônica

Média Geométrica A média geométrica ( )gx é uma média usualmente empregada para avaliar taxas de variação e de crescimento.

Esta média, diferentemente da aritmética, não é influenciada por valores extremos.

Média Geométrica Simples

A média geométrica de N valores ( )1 2, , , nx x x é definida como a raiz n-ésima do produto de desses valores.

1 21

NN Ng n i

i

x x x x x=

= ⋅ ⋅ ⋅ = ∏Exemplo: Calcular a média geométrica dos valores: 2, 4, 6, 9.

4 42 4 6 9 432 4,5590gx = ⋅ ⋅ ⋅ = =

Média Geométrica ponderada

Para uma seqüência numérica 1 2, , , nx x x afetada de pesos 1 2, , , np p p , respectivamente, a média

geométrica ponderada ( )gx é definida por: 1 211 2

N

ini

ppp p

g nx x x x=∑

= ⋅ ⋅ ⋅

Exemplo: Sejam os valores 1, 2, 5 com pesos 3, 3, 1, respectivamente. Então, a média geométrica ponderada será:

7 3 3 1 7 71 2 5 1 8 5 40 1,6938gx = ⋅ ⋅ = ⋅ ⋅ = =

Na prática gx é calculada por meio de logaritmo.

( ) ( )1 2 1 21log log log log logN

g n nx x x x x x xN

= ⋅ ⋅ ⋅ = ⋅ + + +

Exemplos: Determinar a média geométrica das séries abaixo:

a) : 3, 27X 3 27 81 9gx = ⋅ = =

b) : 1, 4, 16X 3 31 4 16 64 4gx = ⋅ ⋅ = =

c) : 7, 7, 7, 7X 4 47 7 7 7 2401 7gx = ⋅ ⋅ ⋅ = =

d) X: 37, 6 37 6 222 14,8997gx = ⋅ = =

Page 50: apostila_estatistica

50

Observação: O produto dos quocientes de cada valor de um conjunto de números pela média geométrica do

conjunto é igual a 1.

1 2 1n

g g g

xx xx x x

⋅ ⋅ ⋅ =

Exemplo:

37 6 114,8997 14,8997

⋅ =

Média Harmônica

A média harmônica ( )hx de um conjunto de N números ( )1 2, , , nx x x é o inverso da média aritmética do

inverso dos valores. Esta média é particularmente utilizada para a série de valores que são inversamente

proporcionais, como para o cálculo da velocidade média.

Média Harmônica Simples

A média harmônica de um conjunto é dada por:

1 2

1 1 1 1h

n i

N Nx

x x x x

= =+ + + ∑

Exemplo: Calcular a média harmônica das séries abaixo:

a) : 1, 2, 4X 3 3 1,71431 1 1 71 2 4 4

hx = = =+ +

b) : 3, 6, 6X 3 3 4,51 1 1 43 6 6 6

hx = = =+ +

c) : 1, 2, 4, 3X 4 4 1,921 1 1 1 251 2 4 3 12

hx = = =+ + +

d) : 7, 7, 7, 7X 4 4 71 1 1 1 47 7 7 7 7

hx = = =+ + +

e) Um caminhão desenvolve uma velocidade média de 30Km/h para ir da cidade A par a cidade B, e 20Km/h para

fazer a viagem de volta. Qual a velocidade média de percurso ida e volta?

Page 51: apostila_estatistica

51

2 2 24 /1 1 530 20 60

hx Km h= = =+

Média Harmônica Ponderada

Sejam 1 2, , , nx x x um conjunto afetado com as freqüências 1 2, , , nf f f , respectivamente. A média

harmônica desse conjunto de números é definida por:

1 2

1 2

i ih

n i

n i

f fx f ff f

x x x x

= =+ + +

∑ ∑∑

Exemplo:

Sejam os valores 2, 4, 12 com pesos 3, 2, 2 respectivamente. A média harmônica é:

7 7 3,23083 2 2 18 6 22 4 12 12

hx = = =+ +

+ +

Exercícios

1) Calcule a média geométrica simples para os conjuntos de dados abaixo:

a) 3, 27

b) 2, 8

c) 1, 4, 16

d) 1, 1, 2, 3, 3

2) Calcule a média harmônica simples para os conjuntos de dados abaixo:

a) 3, 6, 8

b) 2, 2, 3, 5

c) 5, 5, 5, 5, 5

3) Um automóvel desenvolve 70 Km/h para ir da cidade A para a B, e volta da cidade B para a A com a velocidade

de 60 Km/h. Qual a velocidade média?

Page 52: apostila_estatistica

52

4) Calcule as médias geométrica e harmônica para os conjuntos abaixo:

a) b)

Resposta dos exercícios do apêndice

1) a) 9 b) 4 c) 4 d) 5 18 1,7826=

2) a) 72 4,815

= b) 120 2,608746

= c) 5

3) 64,6 /Km h

4) a) 12 12432 1,6581 1,41188,5g hx x= = = =

b) 7 1401280 2,779 2,592654g hx x= = = =

ix if

1 7

3 3

4 2

Total 12

ix if

2 4

4 2

5 1

Total 7

Page 53: apostila_estatistica

53

CAPÍTULO 4 - SEPARATRIZES

4.1 . Introdução

As separatrizes são números reais que dividem a seqüência ordenada de dados (Rol) em partes que contêm uma

quantidade específica de elementos da série.

Desta forma, a mediana que divide a seqüência ordenada em dois grupos, cada um deles contendo 50% dos valores

da seqüência, é também uma medida separatriz.

Além da mediana, as outras medidas separatrizes que destacamos são: quartis, decis e percentis.

4.2 . Quartil

Ao dividirmos uma série ordenada em quatro partes iguais, cada uma ficará com 25% dos elementos. Os três

elementos que separam estes grupos são chamados de Quartis.

Assim, o primeiro quartil, que indicaremos por 1Q , separa a seqüência ordenada deixando 25% de seus valores à

esquerda e 75% de seus valores à direita.

O segundo quartil, que indicaremos por 2Q , separa a seqüência ordenada deixando 50% de seus valores à esquerda

e 50% de seus valores à direita. O 2Q é a mediana da série.

O terceiro quartil, que indicaremos por 3Q , separa a seqüência ordenada deixando 75% de seus valores à esquerda e

25% de seus valores à direita.

4.3 . Decil

Ao dividirmos uma série ordenada em dez partes iguais, cada uma ficará com 10% dos elementos. Os elementos

que separam estes grupos são chamados de Decis.

Assim, o primeiro decil, que indicaremos por 1D , separa a seqüência ordenada, deixando 10% de seus valores à

esquerda e 90% de seus valores à direita.

Os outros decis são definidos de modo análogo.

1Q 2Q Md= 3Q

25% 25% 25% 25%

Page 54: apostila_estatistica

54

4.4 . Percentil

Ao dividirmos uma série ordenada em cem partes iguais, cada uma ficará com 1% dos elementos. Os elementos que

separam estes grupos são chamados de percentis.

Assim, o primeiro percentil, que indicaremos por 1P , separa a seqüência ordenada, deixando 1% de seus valores à

esquerda e 99% de seus valores à direita.

Os outros percentis são definidos de modo análogo.

Se observarmos que os quartis e os decis são múltiplos dos percentis, então basta estabelecer a fórmula de cálculo de

percentis. Todas as outras medidas podem ser identificadas como percentis. Desta forma:

1 25

2 50

3 75

Q PQ PQ P

=

=

=

1 10

2 20

3 30

4 40

5 50

6 60

7 70

8 80

9 90

D PD PD PD PD PD PD PD PD P

=

=

=

=

=

=

=

=

=

4.5 . Cálculo de Separatrizes

4.5.1 . Dados brutos ou Rol

Para identificar uma determinada separatriz os dados devem estar ordenados. Em seguida relacionamos a medida

que queremos obter com o percentil correspondente, iP .

Encontramos a posição do percentil i , através de 100i n⋅

. Em seguida, identificamos o elemento que ocupa esta

posição. Se 100i n⋅

não for um número inteiro, isto significa que o iP é um elemento intermediário entre os

elementos que ocupam as posições aproximadas por falta e por excesso do valor 100i n⋅

. Neste caso, o iP é definido

como sendo a média dos valores que ocupam estas posições aproximadas.

Page 55: apostila_estatistica

55

Exemplo:

1) Calcular o 1Q da seqüência 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15.

Identificamos que 1 25Q P=

Calcularmos 25% de 12, que é o número de elementos da série, obtendo: 25 12 3100

⋅=

Este valor indica a posição do 25P no rol, isto é, o 25P é o terceiro elemento no rol. Observando o terceiro

elemento do rol obtém-se 5.

Portanto, 1 25 5Q P= =

Assim, 25% dos valores desta seqüência são valores menores ou iguais a 5 e 75% dos valores desta seqüência são

valores maiores ou iguais a 5.

2) Calcular o 6D do rol 2; 2; 6; 7,5; 8; 9; 10; 12

Identificamos que 6 60D P= .

Calcularmos 60% de 8, que é o número de elementos da série, obtendo: 60 8 4,8100

⋅=

Este valor não é inteiro, indicando que o 60P é um valor situado entre o quarto e o quinto elemento da seqüência.

Observando diretamente no rol, os elementos que ocupam a quarta e quinta posição são: 7,5 e 8. Portanto

6 607,5 8 7,75

2D P +

= = =

Assim, 60% dos valores desta seqüência são valores menores ou iguais a 7,75 e 40% dos valores desta seqüência são

valores maiores ou iguais a 7,75.

4.5.2 . Dados agrupados em freqüência simples

Se os dados estão apresentados na forma de variável discreta, eles já estão naturalmente ordenados.

Devemos identificar a medida que queremos obter com o percentil correspondente iP . Em seguida, localizar a

posição do percentil na série 100i n⋅

. Após, com o auxílio da freqüência acumulada da série, localizamos o elemento

que ocupa esta posição. O valor deste elemento é o iP .

Page 56: apostila_estatistica

56

Exenplo:

1) Calcular o 4D para a série:

ix if iF

2 3 3

4 5 8

5 8 16

7 6 22

10 2 24

Total 24 -

O número de elementos da série é 24if =∑ .

Identificamos 4 40D P= , e calculamos 40% de 24, ou seja, 40 24 9,6100

⋅=

Esta posição significa que o 40P é um valor compreendido entre o nono e o décimo elemento da série.

Observando na coluna da freqüência acumulada, vemos que o nono e o décimo elemento são iguais a 5. Assim,

4 405 5 5

2D P +

= = =

Dessa forma, 40% dos valores desta seqüência são valores menores ou iguais a 5 e 60% dos valores desta seqüência

são valores maiores ou iguais a 5.

4.5.3 . Dados agrupados em classe

Se os dados estão agrupados na forma de uma variável contínua, eles já estão naturalmente ordenados e o número de

elementos da série é in f= ∑ .

Para se obter uma fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula da mediana:

2 i

ii

n F antMd l h

f md

−= + ⋅

Identificando 50Md P= , podemos obter uma fórmula particular para o 50P . Portanto, identificando o limite

inferior da classe que contém a Mediana ( )il com o limite inferior da classe que contém 50P ( )50l .

Page 57: apostila_estatistica

57

O termo 2n

pode ser representado na linguagem do 50P como 50100

n⋅.

A freqüência simples da classe mediana ( )if é a mesma freqüência simples da classe que contém o 50P ( )50f .

A freqüência acumulada da classe anterior à classe mediana ( )antF é a freqüência acumulada da classe anterior à

classe que contém o 50P . Este termo não se modifica, assim como h , que é a amplitude do intervalo de classe.

Assim, a fórmula da mediana, adaptada para a linguagem do 50P pode ser escrita:

50100 i

ii

i n F antP l h

f

⋅−

= + ⋅

Substituindo-se 50 pelo índice i , generalizamos a fórmula para o cálculo de qualquer percentil:

100 i

i ii

i n F antP l h

f

⋅−

= + ⋅

Onde:

iP = Percentil ( ) 1, 2, 3, , 99i i =

il = limite inferior da classe que contém o percentil i

n = número de elementos da série

iF ant = freqüência acumulada da classe anterior à classe que contém o percentil i

if = freqüência simples da classe que contém o percentil i

h = amplitude do intervalo de classe.

Exemplo: Calcular o 3Q da série:

Notas if iF

0 |⎯⎯ 10 16 16

2010 |⎯⎯ 18 34

3020 |⎯⎯ 24 58

4030 |⎯⎯ 35 93

5040 |⎯⎯ 12 105

Total 105 -

Page 58: apostila_estatistica

58

O número de elementos da série é 105. Identificamos 3 75Q P= .

Iniciamos o cálculo do valor 75P lembrando que neste caso 75i = e que 75 105 78,75

100 100i n⋅ ⋅

= = .

Isto nos dá a posição do 75P na série.

Pela freqüência acumulada observamos que o elemento que ocupa a posição 78,75 na série encontra-se na quarta

classe.

Substituindo os valores indicados na fórmula, obtém-se:

7578,75 5830 10 35,93

35P −

= + ⋅ =

Assim, 75% dos valores da série são menores ou iguais a 35,93 e 25% dos valores da série são maiores ou iguais a

35,93.

Exercícios

1) A tabela abaixo representa a distribuição dos salários de 500 empregados da firma X . Calcule:

a) o primeiro quartil

b) o segundo decil

c) o quinquagésimo percentil

d) o octogésimo percentil

Salários if iF

1000 |⎯⎯ 2000 20 20

30002000 |⎯⎯ 20 40

40003000 |⎯⎯ 100 140

50004000 |⎯⎯ 80 220

60005000 |⎯⎯ 70 290

70006000 |⎯⎯ 60 350

80007000 |⎯⎯ 150 500

Total 500 -

Page 59: apostila_estatistica

59

2) Para a tabela do exercício 4 do capítulo 2 determine:

a) o número de horas extras em que 25% dos técnicos trabalham abaixo e 75% dos técnicos trabalham acima desse

valor.

b) o terceiro quartil.

c) o número de horas em que 30% dos técnicos trabalham acima desse valor.

d) o 37º percentil.

e) o número de horas extras em que 40% dos técnicos trabalham abaixo desse valor.

3) Para a tabela do exercício 5 do capítulo 2 determine:

a) o terceiro quartil.

b) o número de faltas em que 20% dos operários tiveram um total de faltas abaixo deste valor.

c) o número de faltas em que 66 operários tiveram um total de faltas abaixo desse valor

4) Para a tabela do exercício 6 do capítulo 2 determine o oitavo decil.

5) Para a tabela do exercício 7 do capítulo 2 determine:

a) o salário em que 44 funcionários ganham abaixo e 36 funcionários ganham acima.

b) o 85o percentil

6) Para a tabela do exercício 8 do capítulo 2 determine o total de horas em que 75% das peças testadas apresentaram

uma duração superior.

7) Para a tabela do exercício 9 do capítulo 2 determine:

a) a carga máxima em que 30 cabos de aço suportam pesos inferiores.

b) o sétimo decil

c) o 35o percentil

4.6 . Resposta dos exercícios

1) a) R$3.850,00 b) R$ 3.600,00 c) R$5.428,57 d) R$7.333,00

2) a) 24,52 hs b) 42,91 hs c) 40,99 hs d) 29,51 hs e) 30,76 hs

3) a) 5,5 faltas b) 1 falta c) 2,4 faltas

4) 1.436,76 peças

5) a) 2,63 SM b) 5,80 SM

6) 646,82 centenas de horas

7) a) 11,1 ton b) 11,35 ton c) 10,68 ton

Page 60: apostila_estatistica

60

CAPÍTULO 5 – MEDIDAS DE DISPERSÃO

5.1 . Introdução

Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são suficientes para

caracterizar totalmente uma seqüência numérica.

Se observarmos as seqüências:

X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10

Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13

Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13

concluiremos que todas possuem média 13.

No entanto, são seqüências completamente distintas do ponto de vista da variabilidade (dispersão) de dados.

Na seqüência Z não há variabilidade de dados. A média 13 representa bem qualquer valor da série.

Na seqüência Y, a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da

média 13.

Na seqüência X existem muitos elementos bastante diferenciados da média 13.

Concluímos que a média 13 representa otimamente a seqüência Z, representa bem a seqüência Y, mas não

representa bem a seqüência X.

O nosso objetivo é construir medidas que avaliem a representatividade da média. Para isso usaremos as medidas de

dispersão.

Observe que na seqüência Z os dados estão totalmente concentrados sobre a média 13.

Não há dispersão de dados. Na seqüência Y há forte concentração dos dados sobre a média 13, mas há fraca

dispersão de dados. Já na série X há fraca concentração de dados em torno da média 13 e forte dispersão de dados

em relação à média 13.

As principais medidas de dispersão que estaremos abordando são: amplitude total, desvio médio simples, variância,

desvio padrão e coeficiente de variação.

5.2 . Amplitude Total

A amplitude total ( )tA é a diferença entre o maior e o menor valor da seqüência.

Page 61: apostila_estatistica

61

5.2.1 . Dados brutos ou rol

Para o cálculo da amplitude total de um rol basta identificar o maior e o menor valor da seqüência e efetuar a

diferença entre estes valores.

Exemplo: Determinar a amplitude total da seqüência X: 11, 12, 9, 10, 10, 15.

O maior valor desta seqüência é 15 e o menor valor é 9. Portanto 15 9 6 unidadestA = − = .

5.2.2 . Dados agrupados em freqüência simples

Como os valores já se apresentam ordenados, a amplitude total é a diferença enter o último e o primeiro elemento da

série.

Exemplo: Determinar a amplitude total da série

ix if

2 1

3 6

5 10

7 3

Total 20

7 2 5 unidadestA = − =

5.2.3 . Dados agrupados em classes

Nesta situação, por desconhecer o maior e o menor valor da série, devemos fazer um cálculo aproximado da

amplitude total da série.

Consideraremos como maior valor da série o ponto médio da última classe e como menor valor da série o ponto

médio da primeira classe. A amplitude total é a diferença entre estes valores.

Exemplo: Determinar a amplitude total da série

Page 62: apostila_estatistica

62

Classes if ix

2 |⎯⎯ 4 5 3

64 |⎯⎯ 10 5

86 |⎯⎯ 20 7

108 |⎯⎯ 7 9

1210 |⎯⎯ 2 11

Total 44 -

11 3 8 unidadestA = − =

Nota: Apesar da facilidade de obtenção da amplitude total, esta medida apresenta a inconveniência de depender

apenas de dois valores da série. É possível modificar completamente a dispersão ou a concentração dos elementos

em torno da média, sem alterar a amplitude total da série. É uma medida que tem pouca sensibilidade estatística.

5.3 . Desvio Médio Simples ( )DMS

O conceito estatístico de desvio corresponde ao conceito matemático de distância (módulo).

A dispersão dos dados em relação à média de uma seqüência pode ser avaliada através dos desvios de cada elemento

da seqüência em relação a média da seqüência.

O desvio médio simples é definido como sendo uma média aritmética dos desvios de cada elemento da série para a

média da série.

5.3.1 . Dados brutos ou rol

Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada elemento da

seqüência para sua média. Finalmente, calculamos a média destas distâncias.

Se a seqüência for representada por 1 2: , , , nX x x x , então o DMS admite como fórmula de cálculo:

ix xDMS

n−

= ∑

Exemplo: Calcular o DMS para a seqüência: X: 2, 8, 5, 6

Determinamos inicialmente a média da série:

2 8 5 6 5,254

ixx

n+ + +

= = =∑

Page 63: apostila_estatistica

63

em seguida, determinamos as distâncias de cada elemento da série para a média da série:

1

2

3

4

2 5, 25 3, 25

8 5, 25 2,75

5 5, 25 0, 25

6 5, 25 0,75

x x

x x

x x

x x

− = − =

− = − =

− = − =

− = − =

O DMS é a média aritmética simples destes valores.

3, 25 2,75 0,25 0,75 7 1,754 4

DMS + + += = =

Ou seja, em média, cada elemento da seqüência está afastado do valor 5,25 por 1,75 unidades.

5.3.2 . Dados agrupados em freqüência simples

No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada elemento representa

o número de vezes que este valor figura na série. Conseqüentemente, haverá repetições de distâncias iguais de cada

elemento distinto da série para a média da série. Assim, a média indicada para estas distâncias é uma média

aritmética ponderada. A fórmula para o cálculo do DMS é:

i i

i

x x fDMS

f−

= ∑∑

Exemplo: Determinar o DMS para a série:

ix if i ix f i ix x f−

1 2 2 1 3 2 4− ⋅ =

3 5 15 3 3 5 0− ⋅ =

4 2 8 4 3 2 2− ⋅ =

5 1 5 5 3 1 2− ⋅ =

Total 10 30 8

A média aritmética da série é: 30 310

i i

i

x fx

f= = =∑

Page 64: apostila_estatistica

64

O DMS é dado por: 8 0,8 unidades

10i i

i

x x fDMS

f−

= = =∑∑

Ou seja, em média, cada elemento da série está afastado do valor 3 por 0,8 unidades.

5.3.3 . Dados agrupados em classes

Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes

valores pelos pontos médios das classes. Desta forma, o desvio médio simples tem por cálculo a fórmula:

i i

i

x x fDMS

f−

= ∑∑

, onde ix é o ponto médio da classe i .

Exemplo: Determinar o DMS para a série:

Classes if ix i ix f i ix x f−

2 |⎯⎯ 4 5 3 15 3 5,1 5 10,5− ⋅ =

64 |⎯⎯ 10 5 50 5 5,1 10 1− ⋅ =

86 |⎯⎯ 4 7 28 7 5,1 4 7,6− ⋅ =

108 |⎯⎯ 1 9 9 9 5,1 1 3,9− ⋅ =

Total 20 - 102 23

A tabela acima já está toda completa com os dados que necessitamos para calcular o DMS . Porém, os seguintes

passo foram seguidos:

1 – cálculo dos pontos médios ix

2 – cálculo de i ix f para obtermos a média que é: 102 5,120

i i

i

x fx

f= = =∑

∑3 – para obter o DMS acrescentamos a última coluna que apresenta i ix x f− . Assim, o DMS é:

23 1,15 unidades20

i i

i

x x fDMS

f−

= = =∑∑

Ou seja, em média, cada elemento da série está afastado do valor 5,1 por 1,15 unidades.

Nota: O desvio médio simples depende de cada componente da série. Se mudarmos o valor de um único elemento

da série, mudamos também o DMS . Portanto, o desvio médio simples tem perfeita sensibilidade estatística.

Page 65: apostila_estatistica

65

5.4 . Variância e Desvio Padrão

Observamos no item anterior que a dificuldade em se operar com o DMS se deve à presença do módulo, para que

as diferenças ix x− possam ser interpretadas como distâncias.

Outra forma de se conseguir que as diferenças ix x− se tornem sempre positivas ou nulas é considerar o quadrado

destas diferenças, isto é: ( )2ix x− .

Se substituirmos, nas fórmulas do DMS a expressão ix x− por ( )2ix x− , obteremos nova medida de

dispersão chamada variância.

Portanto, variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos

da série e a sua média.

O desvio padrão é a raiz quadrada positiva da variância.

Em particular, para estas medidas levaremos em consideração o fato de a seqüência de dados representar toda uma

população ou apenas uma amostra de uma população.

Quando a seqüência de dados representa uma população a variância será denotada por ( )2 xσ , 2xσ ou

simplesmente 2σ e o desvio padrão correspondente por ( )xσ , xσ ou simplesmente σ .

Quando a seqüência de dados representar uma amostra, a variância será denotada por ( )2s x , 2xs ou simplesmente

2s e o desvio padrão correspondente por ( )s x , xs ou simplesmente s ., a menos de uma observação.

Assim temos:

População: ( ) ( )22 ix x

xn

σ−

= ∑ ( ) ( )2x xσ σ=

Amostra: ( ) ( )22

1ix x

s xn

−=

−∑ ( ) ( )2s x s x=

5.4.1 . Dados brutos ou rol

Exemplo:

1) Calcule a variância e o desvio padrão da seqüência: X: 4, 5, 8, 5, sendo esta representativa de uma população.

Esta seqüência tem 4n = elementos e tem por média:

Page 66: apostila_estatistica

66

4 5 8 5 22 5,54 4

ixx

n+ + +

= = = =∑

Os quadrados das diferenças ( )2ix x− valem:

( ) ( )

( ) ( )

( ) ( )

( ) ( )

2 21

2 22

2 23

2 24

4 5,5 2,25

5 5,5 0,25

8 5,5 6,25

5 5,5 0,25

x x

x x

x x

x x

− = − =

− = − =

− = − =

− = − =

Somando-se estes valores obtém-se: ( )2 9ix x− =∑ .

Substituindo estes valores na fórmula da variância, teremos: ( ) ( )22 9 2, 25

4ix x

xn

σ−

= = =∑

Como o desvio padrão é a raiz quadrada positiva da variância, temos: ( ) ( )2 2, 25 1,5 unidx xσ σ= = = .

b) Se a seqüência anterior representasse apenas uma amostra, a variância e o desvio padrão seriam:

( ) ( )22 9 3

1 3ix x

s xn

−= = =

−∑ ( ) ( )2 3 1,73s x s x= = =

5.4.2 . Dados agrupados em freqüência simples

Como há repetição de elementos na série, definimos a variância como sendo uma média aritmética ponderada dos

quadrados dos desvios dos elementos da série para a média da série.

Dependendo se a variável em estudo é representativa de uma população ou de uma amostra, as fórmulas da

variância e do desvio padrão ficam:

População: ( ) ( )22 i i

i

x x fx

−= ∑

∑( ) ( )2x xσ σ=

Amostra: ( ) ( )22

1i i

i

x x fs x

f−

=−

∑∑

( ) ( )2s x s x=

Page 67: apostila_estatistica

67

Exemplo:

1) Calcule a variância e o desvio padrão da série abaixo, representativa de uma população.

ix if i ix f ( )2i ix x f−

2 3 6 ( )22 3,65 3 8,1675− ⋅ =

3 5 15 ( )23 3,65 5 2,1125− ⋅ =

4 8 32 ( )24 3,65 8 0,9800− ⋅ =

5 4 20 ( )25 3,65 4 7,2900− ⋅ =

Total 20 73 18,55

A média as série é: 73 3,6520

i i

i

x fx

f= = =∑

Variância: ( ) ( )22 18,75 0,9275

20i i

i

x x fx

−= = =∑

Desvio padrão: ( ) ( )2 0,9275 0,963x xσ σ= = =

2) Se a série anterior fosse representativa de uma amostra, teríamos os seguintes resultados para a variância e o

desvio padrão:

Variância: ( ) ( )22 18,55 0,9763

1 19i i

i

x x fs x

f−

= = =−

∑∑

Desvio padrão: ( ) ( )2 0,9763 0,988s x s x= = =

5.4.3 . Dados agrupados em classes

Novamente, por desconhecer os particulares valores de ix da série, substituiremos nas fórmulas anteriores estes

valores pelos pontos médios das classes.

Exemplo:

1) Calcule a variância e o desvio padrão da série abaixo, representativa de uma população.

Page 68: apostila_estatistica

68

Classes if ix i ix f ( )2i ix x f−

0 |⎯⎯ 4 1 2 2 ( )22 8,4 1 40,96− ⋅ =

84 |⎯⎯ 3 6 18 ( )26 8,4 3 17,28− ⋅ =

128 |⎯⎯ 5 10 50 ( )210 8,4 5 12,80− ⋅ =

1612 |⎯⎯ 1 14 14 ( )214 8,4 1 31,36− ⋅ =

Total 10 - 84 102,4

A média as série é: 84 8,410

i i

i

x fx

f= = =∑

Variância: ( ) ( )22 102,4 10,24

10i i

i

x x fx

−= = =∑

Desvio padrão: ( ) ( )2 10, 24 3, 2x xσ σ= = =

2) Se a série anterior fosse representativa de uma amostra, teríamos os seguintes resultados para a variância e o

desvio padrão:

Variância: ( ) ( )22 102, 4 11,38

1 9i i

i

x x fs x

f−

= = =−

∑∑

Desvio padrão: ( ) ( )2 11,38 3,373s x s x= = =

Nota: No cálculo da variância, quando elevamos ao quadrado a diferença ( )ix x− , a unidade de medida da série

fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade de medida da série.

Se os dados são expressos em metros, a variância é expressa em metros quadrados.

Em algumas situações a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados

são expressos em litros. A variância será expressa em litros quadrados. Portanto, o valor da variância não pode ser

comparado diretamente com os dados da série, ou seja, a variância não tem interpretação.

Exatamente para suprir esta deficiência da variância é que se define o desvio padrão. Como o desvio padrão é a raiz

quadrada da variância, o desvio padrão terá sempre a mesma unidade de medida da série e portando admite

interpretação.

Page 69: apostila_estatistica

69

5.5 . Interpretação do Desvio Padrão

1) O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.

É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados da série.

Quando uma curva de freqüência representativa da série é perfeitamente simétrica como a curva abaixo, podemos

afirmar que o intervalo [ ],x xσ σ− + contém aproximadamente 68% dos valores da série.

O intervalo [ ]2 , 2x xσ σ− + contém aproximadamente 95% dos valores da série.

O intervalo [ ]3 , 3x xσ σ− + contém aproximadamente 99% dos valores da série.

xx σ− x σ+

σ σ

x2x σ− 2x σ+

σ σσ σ

x3x σ− 3x σ+

σ σσ σσ σ

Page 70: apostila_estatistica

70

Estes percentuais 68%, 95% e 99% que citamos na interpretação podem ser comprovados, com maior precisão, no

estudo da distribuição normal de probabilidades.

Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam pequenas variações para mais ou

para menos, segundo o caso.

Dessa forma, quando se afirma que uma série apresenta média 100x = e desvio padrão 5σ = , podemos

interpretar estes valores da seguinte forma:

♦ Os valores da série estão concentrados em torno de100.

♦ O intervalo [ ]95, 105 contém aproximadamente, 68% dos valores da série.

♦ O intervalo [ ]90, 110 contém aproximadamente, 95% dos valores da série.

♦ O intervalo [ ]85, 115 contém aproximadamente, 99% dos valores da série.

É importante que se tenha percebido que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de

elementos contidos no intervalo.

As medidas de dispersão vistas até agora são medidas absolutas e portanto avaliam a dispersão absoluta da série.

Todas elas são diretamente proporcionais à dispersão absoluta.

Assim, se a série X apresenta 20x = e ( ) 3xσ = , e se a série Y apresenta 22y = e ( ) 2yσ = , podemos

afirmar, comparando os desvios, que a série X apresenta maior dispersão absoluta.

2) Para justificar que o denominador da variância amostral deve ser 1n − e não n , usaremos o seguinte argumento:

O modelo matemático que calcula a variância de uma amostra não pode ser ( ) ( )22 ix x

xn

σ−

= ∑ , pois caso

isto fosse verdadeiro, este modelo deveria determinar a variância para qualquer tamanho de amostra.

Suponha uma amostra constituída de um único elemento 1x . O valor médio da amostra também é 1x . Calculando

a variância pelo modelo acima, teremos: ( ) ( ) ( )2 21 12 0

1ix x x x

xn

σ− −

= = =∑ .

Seríamos induzidos a afirmar que a dispersão da população de onde provém a amostra é zero, isto é, a população é

constituída em sua totalidade por elementos idênticos. O que é, em geral, uma afirmação falsa.

Para corrigir o modelo matemático, basta colocar no denominador 1n − . O modelo é escrito então:

( ) ( )22

1ix x

xn

σ−

=−

Observe que agora o modelo é coerente. Mesmo quando a amostra tiver apenas um elemento 1x , o cálculo de

( )2s x leva-nos a uma indeterminação do tipo 00

. O que significa que a variância existe, mas não está

Page 71: apostila_estatistica

71

determinada. Significa também que amostras de apenas um elemento não nos fornecem informações sobre a

variância da série.

Cabe ressaltar que, para alguns autores, quando o desvio padrão representar uma estatística de uma amostra

considerada pequena ( )30n ≤ , o denominador no desvio padrão deverá ser n -1. A razão disto, é que se obtém

uma melhor estimativa do parâmetro da população. Para grandes valores de n ( )30n ⟩ não há grande diferença

entre a utilização de um ou outro denominador.

Exercício 1

1) Calcule a variância e o desvio padrão das séries abaixo, provenientes de uma amostra.

a) 1, 3, 4, 8

b) 12, 10, 20, 13, 15

c) 9, 9, 9, 9, 9, 9

2) Baseado nas informações das notas dos alunos A, B, C e D, determine qual o melhor aluno e por quê?

A – 7, 7, 10, 10, 1

B – 7, 7, 7, 7, 7

C – 10, 10, 10, 5, 0

D – 10, 1, 7, 7, 10

3) Calcule a variância e o desvio padrão das séries abaixo (amostra):

a)

Sal. min if

1 7

3 3

4 2

Total 12

b)

Notas if

2 4

4 2

5 1

Total 7

Page 72: apostila_estatistica

72

4) Determinar a variância e o desvio padrão das distribuições apresentadas nos exercícios 4 a 9 do capítulo 2.

5.6 . Coeficiente de Variação

Se uma série X apresenta 10x = e ( ) 2xσ = , e uma série Y apresenta 100y = e ( ) 5yσ = , do ponto de

vista da dispersão absoluta, a série Y apresenta maior dispersão que a série X .

No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y que é 5 em relação a 100 é um

valor menos significativo do que o desvio padrão de X que é 2 em relação a 10.

Isto nos leva a definir uma medida de dispersão relativa: o coeficiente de variação.

O coeficiente de variação de uma série X é indicado por ( )xCV e é definido como: ( )( )

xx

CVx

σ= .

Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro,

podendo ser expresso em percentual.

Deste modo, se calcularmos o coeficiente de variação das séries X e Y obteremos:

( )2 0,2 ou 20%

10xCV = = ( )5 0,05 ou 5%

100yCV = =

Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão relativa. Como

a medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série, é uma

medida mais completa que a medida de dispersão absoluta.

Portanto, a medida de dispersão relativa prevalece sobre a medida de dispersão absoluta. Podemos afirmar que a

série que tem a maior dispersão relativa tem, de modo geral, a maior dispersão.

Do exemplo anterior, concluímos que:

A série Y apresenta maior dispersão absoluta.

A série X apresenta maior dispersão relativa.

Portanto, A série X apresenta maior dispersão.

Exercício 2

1) Uma indústria de componentes elétricos fábrica um tipo de lâmpada cuja duração média é de 15 dias, com um

desvio padrão de 0,26 dias. Um novo tipo de lâmpada foi lançado pela empresa, e constatou-se que a duração média

era de 18 dias com um desvio padrão de 0,9. Determinar qual é a melhor lâmpada e por quê?

Page 73: apostila_estatistica

73

2) Determinar o coeficiente de variação utilizando os dados das tabelas apresentadas nos exercícios 4 a 9 do capítulo

2.

3) Uma amostra aleatória de 250 residências de famílias, classe média, com dois filhos, revelou a seguinte

distribuição do consumo mensal de energia elétrica.

Consumo mensal

(Kwh) if

0 |⎯⎯ 50 2

10050 |⎯⎯ 15

150100 |⎯⎯ 32

200150 |⎯⎯ 47

250200 |⎯⎯ 50

300250 |⎯⎯ 80

350300 |⎯⎯ 24

Total 250Pede-se:

a) O consumo médio por residência.

b) As freqüências simples e acumulada (absoluta e relativa).

c) A porcentagem de famílias com consumo mensal maior ou igual a 200 e menor que 250 Kwh.

d) A porcentagem de famílias com consumo mensal menor que 200 Kwh.

e) A porcentagem de famílias com consumo maior ou igual a 250 Kwh.

f) O consumo mediano.

g) A moda de Czuber.

h) A amplitude total da série.

i) O desvio médio simples.

j) A variância.

k) O desvio padrão.

l) O coeficiente de variação.

m) 1Q

n) 3Q

o) 10P

p) 6D

q) 80P

Page 74: apostila_estatistica

74

r) O percentual de famílias classificadas entre 1Q e 80P .

s) O número aproximado de famílias classificadas entre 10P e 3Q .

4) Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta

amostra apresentou a seguinte distribuição.

Valor da nota

(em mil)) if

7 |⎯⎯ 12 2

1712 |⎯⎯ 5

2217 |⎯⎯ 13

2722 |⎯⎯ 10

3227 |⎯⎯ 9

3732 |⎯⎯ 6

4237 |⎯⎯ 5

Total 50Pede-se:

a) O valor médio das notas.

b) As freqüências simples e acumulada (absoluta e relativa).

c) A porcentagem de notas com valor maior ou igual a $17.000 e menor que $22.000.

d) A porcentagem de notas com valor menor que $32.000.

e) A porcentagem de notas com valor maior ou igual a $32.000.

f) O valor mediano das notas.

g) A moda de Czuber.

h) A amplitude total da série.

i) O desvio médio simples.

j) A variância.

k) O desvio padrão.

l) O coeficiente de variação.

m) 1Q

n) 3Q

o) 10P

p) 6D

Page 75: apostila_estatistica

75

q) 80P

r) O percentual de notas entre 1Q e 80P .

s) O número aproximado de notas entre 10P e 3Q .

5.7 . Resposta dos exercícios

Exercício 1

1) a) 2 8,67 e 2,94s s= = b) 2 14,5 e 3,81s s= = c) 2 0s s= =

2) 3,67 0 4,47 3,67A B C Dσ σ σ σ= = = =

Apesar de terem a mesma média, o aluno B pode ser apontado como melhor aluno por apresentar menor dispersão

das notas.

3) a) 2 1,64 e 1, 28σ σ= = b) 2 1,67 e 1, 29σ σ= =

4) 2 132 e 11,48 horasσ σ= =

2 7, 29 e 2,7 faltasσ σ= =

2 3.326,04 e 57,67 peçasσ σ= =

2 5,87 e 2, 42 SMσ σ= =

2 27.714,05 e 166,48 centenas de horasσ σ= =

2 0, 48 e 0,69 toneladasσ σ= =

Exercício 2

1) 0, 26 0,0215antigaCV = =

0,9 0,0518novaCV = =

Apesar de haver um acréscimo de 3 dias na vida média da lâmpada, o desvio padrão também aumentou em maiores

proporções o que significa que a lâmpada antiga é um melhor produto (mais homogêneo).

2) 0,35CV = 0,75CV = 0,04CV =

0,81CV = 0, 22CV = 0,06CV =

Page 76: apostila_estatistica

76

3) a) 217,8

b)

Consumo mensal

(Kwh) ififr

(%)iF iFr

0 |⎯⎯ 50 2 0,80 2 0,80

10050 |⎯⎯ 15 6,00 17 6,80

150100 |⎯⎯ 32 12,80 49 19,60

200150 |⎯⎯ 47 18,80 96 38,40

250200 |⎯⎯ 50 20,00 146 58,40

300250 |⎯⎯ 80 32,00 226 90,40

350300 |⎯⎯ 24 9,60 250 100,00

Total 250 100 - -

c) 20% d) 38,4% e) 41,6% f) 229 g) 267,44 h) 300 i) 60,07

j) 5.148,76 k)71,75 l) 32,95% m) 164,36 n) 275,94 o) 112,5

p) 252,5 q) 283,75 r) 55% s) 163

4) a) $ 25.200

b)

Valor da nota

(em mil)) ififr

(%)iF iFr

7 |⎯⎯ 12 2 4 2 4

1712 |⎯⎯ 5 10 7 14

2217 |⎯⎯ 13 26 20 40

2722 |⎯⎯ 10 20 30 60

3227 |⎯⎯ 9 18 39 78

3732 |⎯⎯ 6 12 45 90

4237 |⎯⎯ 5 10 50 100

Total 50 100 - -

c) 26% d) 78% e) 22% f) $24.500 g) $20.636,36 h) $30.000

i) $6.640 j) 65.316.326,53 k) $8.081,85 l) 32% m) $19.115,38

n) $31.166,67 o) $15.000,00 p) $27.000,00 q) $32.833,23 r) 55% s) 33