Medidas de Centralidade_aula 2

12
Aula 2 Medidas de Centralidade: Média Aritmética, Mediana e Moda, Outras medidas de posição. Medidas de Centralidade São assim chamadas porque podem ser localizadas no próprio sistema de coordenadas em que os dados são representados. No tópico anterior resumimos o conjunto de dados brutos em tabelas de freqüência e gráficos a4 fim de obtermos informações mais claras sobre o fenômeno em estudo. Muitas vezes, precisamos resumir ainda mais esses dados e para isto precisamos de valores representativos do conjunto de valores. Algumas destas medidas, que estudaremos a seguir, são a média, mediana e moda. Considere as seguintes notações: , , , á ó 1 é Média Aritmética Podemos definir media aritmética de um conjunto x1, x2, x3,…,xn como: 1 Para valores agrupados podemos utilizar também o seguinte procedimento: Mediana A mediana é o valor central de um conjunto de dados ordenados ··· A posição central do conjunto pode se dada por: Moda A moda é o valor mais freqüente de um conjunto de valores. Podemos considerar mais de um valor para a moda. Se não houver nenhum valor mais freqüente dizemos que não existe moda para este conjunto e escrevemos (). Pode ocorrer ainda uma moda (unimodal), duas modas (bimodal), etc. Md(x) = Se n for impar Se n for par

Transcript of Medidas de Centralidade_aula 2

Page 1: Medidas de Centralidade_aula 2

Aula 2 Medidas de Centralidade: Média Aritmética, Mediana e Moda, Outras medidas de posição. Medidas de Centralidade

São assim chamadas porque podem ser localizadas no próprio sistema de coordenadas em que os dados são representados. No tópico anterior resumimos o conjunto de dados brutos em tabelas de freqüência e gráficos a4 fim de obtermos informações mais claras sobre o fenômeno em estudo. Muitas vezes, precisamos resumir ainda mais esses dados e para isto precisamos de valores representativos do conjunto de valores. Algumas destas medidas, que estudaremos a seguir, são a média, mediana e moda. Considere as seguintes notações: �� � �������� � �� ������ �� , ��, ��,�� �� � ���� ���� ����á��� �

����

���� ���ó��� �� ���� � ������ �� �� �� � � 1 ��é � � �

Média Aritmética Podemos definir media aritmética de um conjunto x1, x2, x3,…,xn como:

� � �� � �� � �� ���� ���� � 1�����

���

Para valores agrupados podemos utilizar também o seguinte procedimento:

� � ���� � ���� � ���� ���� ������� � �� � �� ���� ��� � ∑ ��������∑ ������

Mediana A mediana é o valor central de um conjunto de dados ordenados � � � � �� � ···� ��

A posição central do conjunto pode se dada por:

Moda A moda é o valor mais freqüente de um conjunto de valores. Podemos considerar mais de um valor para a moda. Se não houver nenhum valor mais freqüente dizemos que não existe moda para este conjunto e escrevemos ∄��(�). Pode ocorrer ainda uma moda (unimodal), duas modas (bimodal), etc.

Md(x) = Se n for impar

���� ��

� � Se n for par

�� ��

Page 2: Medidas de Centralidade_aula 2

2 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Exemplo 1: Considere que 10 lâmpadas foram testadas para determinar o tempo de vida útil (em horas). Vamos determinar a média aritmética, a mediana e moda do tempo de vida útil das lâmpadas. 615 1020 1035 690 970 1020 1150 1100 850 1020 Solução: 1) Media aritmética � �

615 � 1020 � 1035 � 690 � 970 � 1020 � 1150 � 1100 � 850 � 102010 �

947010

� � 947

2) Mediana

Para calcular a mediana devemos ordenar os dados. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

615 690 850 970 1020 1020 1020 1035 1100 1150

Temos n = 10 (par) e, portanto, a mediana é dada por:

"�#�$ � ���� ��

� �2 � �� ���2 � 1020 � 10202 � 1020

3) Moda

O valor mais freqüente deste conjunto de valores é 1020, logo: Mo(x) = 1020 Exemplo 2: O controle de qualidade de uma indústria forneceu o seguinte número de peças defeituosas (por lote de 100 unidades): 5 3 9 6 2 8 1 4 5 6 11 Calcule o valor da media aritmética, mediana e moda do número de peças defeituosas. Solução:

1) Media aritmética � � 5 � 3 � 9 � 6 � 2 � 8 � 1 � 4 � 5 � 6 � 1111 � 6011 � 5,45

� � 5,45

2) Mediana Para obter a mediana devemos ordenar os dados.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11

1 2 3 4 5 5 6 6 8 9 11

Page 3: Medidas de Centralidade_aula 2

3 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

n = 11 (impar) e, portanto, o valor central é dado por ������

� ��. O valor que ocupa a 6ª posição é o número 5. Logo, Md(x) = 5

3) Moda Neste conjunto temos dois valores mais freqüente o 5 e 6, logo: Mo(x) = 5 e Mo(x) = 6 Exemplo 3: O sulfito de sódio (Na2SO3) é usado como conservante em alimentos. Ele é encontrado em refrigerantes, concentrados de frutas, chocolates, sucos, queijos fundidos, margarinas, conservas vegetais, carnes, pães, farinhas e em milhares de outros alimentos industrializados. Uma denuncia de intoxicação alimentar levou a investigação de um lote de 20 latas de certo produto. Os resultados são dados abaixo (em g de Na2SO3 por 100g do produto): 0,04 0,04 0,06 0,02 0,05 0,07 0,06 0,03 0,04 0,05 0,05 0,03 0,03 0,05 0,06 0,07 0,05 0,06 0,04 0,04 Determine a média aritmética, mediana e moda. Solução: Podemos calcular as medidas solicitadas usando os procedimentos anteriores, porém, outra alternativa é calcular estas medidas a partir dos dados organizados em uma tabela de freqüência.

1) Media aritmética

2) Mediana

� � 20 #���$ + ����� ���

� �2 � ��� � ���2

nj · xi

0,02 0,09 0,16 0,30 0,24 0,14

0,95

� � 0,0475

� � ∑ �������∑ ��

���

Na2SO3 xi ni

0,02 1 0,03 3 0,04 4 0,05 6 0,06 4 0,07 2 Total n = 20

� � 0,9520 � 0,0475

Page 4: Medidas de Centralidade_aula 2

4 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

x10 = 0,05 e x11 =0,05 "�#�$ � ��� � ���2 � 0,05 � 0,052 � 0,05 3) Moda Mo(x) = 0,05 Exemplo 4: Suponha que o sindicato dos engenheiros solicite a uma pequena empresa o valor médio dos salários pagos aos seus empregados. Os valores levantados pelo setor de Recursos Humanos são apresentados abaixo: Determine a média aritmética, mediana e moda dos salários Solução:

Salário (R$) ni

400 800 50 800 1200 35 1200 1800 30 1800 3200 15 3200 6000 4

6000 10000 1 Total n = 135

fac Posição 1 1a 4 2a a 4a 8 5a a 8a 14 9a a 14a 18 15a a 18a 20 19a a 20a - -

Na2SO3 xi ni

0,02 1 0,03 3 0,04 4 0,05 6 0,06 4 0,07 2 Total n = 20

Posição x10 e x11

Na2SO3 xi ni

0,02 1 0,03 3 0,04 4 0,05 6 0,06 4 0,07 2 Total n = 20

0,05 é mais freqüente

Page 5: Medidas de Centralidade_aula 2

5 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

1) Media aritmética Solução:

� � ∑ ��������∑ ������� 173900135 , 1.288,15

A média aritmética é um valor representativo muito utilizado, porém, em muitas situações outras medidas de resumo são mais adequadas, pois a média aritmética sofre a influência de dados mais extremos. Note que, embora aproximadamente 40% dos empregados desta empresa ganhe menos do que R$800,00, a média aritmética dos salários foi R$1.288,15, ou seja, ela foi influenciada por salários mais altos. Para a empresa é mais conveniente apresentar esta medida de resumo, pois mostra que seus empregados são bem remunerados, mas para o sindicato a apresentação de outra medida de resumo pode ser mais conveniente.

2) Mediana Sabemos que a mediana divide o conjunto de dados em duas partes iguais, portanto, representa 50% dos valores acumulados. De R$400,00 (inclusive) a R$800,00 (exclusive) temos 37,04% dos valores. De R$400,00 (inclusive) a R$ 1.200,00 (exclusive) temos 62,96% dos valores acumulados, portanto o valor que representa 50% dos valores acumulados está nesta classe, ou seja, entre R$800,00 e R$1.200,00. Veja: Note que 37,04% + 12,96% = 50%

Salário (R$) ni

400 800 50 800 1200 35 1200 1800 30 1800 3200 15 3200 6000 4

6000 10000 1 Total n = 135

ponto médio xi nj · xi

600 30000 1000 35000 1500 45000 2500 37500 4600 18400 8000 8000

- 173900

Salário (R$) ni

400 800 50 800 1200 35 1200 1800 30 1800 3200 15 3200 6000 4

6000 10000 1 Total n = 135

fr (%)

fra (%)

37,04 37,04 25,93 62,96 22,22 85,19 11,11 96,30 2,96 99,26 0,74 100,00

100,00 -

Classe mediana

37,04%

12,96%

400

50%

800 120000

180000

3200000

60000

10000 Md(x)

Page 6: Medidas de Centralidade_aula 2

6 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Fazendo a interpolação matemática obtemos a mediana "�#�$ . 80012,96 � 1200 . 80025,93

"�#�$ � 800 � 12,96 � #1200 . 800$25,93 � 999,92 A mediana também pode ser obtida pela fórmula:

"�#�$ � ℓ� � �2 . ∑//��· 0

Onde: ℓ� = limite inferior da classe mediana. n = número total de itens dos dados ∑/ = soma de todas as freqüências das classes inferiores a mediana. /�� = freqüência de classe mediana. C = amplitude do intervalo da classe mediana. Geometricamente, a mediana é o valor de x (abscissa) correspondente à linha vertical que divide o histograma em duas áreas iguais. Do exemplo anterior temos: ℓ� � 800 /�� � 35 � � 135 0 � 400 �/ � 50 "�#�$ � 800 � 1352 . 5035 400 "�#�$ � 1000 Note que o erro de 0,08 em relação ao calculo anterior ocorre devido às aproximações nos valores percentuais.

3) Moda No caso de dados contínuos podemos construir uma curva de freqüência e obter a moda no ponto de ordenada máxima. Desta forma podemos obter a moda da seguinte maneira:

Salário (R$) ni 400 800 50 800 1200 35 800 1200 30 1800 3200 15 3200 6000 4

6000 10000 1 Total n = 135

Classe modal

Page 7: Medidas de Centralidade_aula 2

7 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

"�#�$ � ℓ� � 2 3�3� � 3�4 � 5

Onde: ℓ� � ����� ��/����� �� 5�� � ���� 3� � ��/����ç� ����� � /���üê�5�� �� 5�� � ���� � � ����������� �������� 3� � ��/����ç� ����� � /���üê�5�� �� 5�� � ���� � � ����������� �� ������ C = amplitude do intervalo da classe modal. Do exemplo dado temos: ℓ� � 400 3� � 50 . 0 � 50 3� � 35 . 30 � 5 0 � 400 "�#�$ � 400 � 2 5050 � 54 � 400 "�#�$ � 763,69 Outras medidas de Posição Quantis Vimos no estudo da mediana que esta medida divide o conjunto de dados ordenados em duas partes iguais, ou seja, 50% dos dados estão à esquerda da mediana e 50% à sua direita. Tal como a mediana, os quantis são medidas obtidas a partir do conjunto de dados ordenados. Estas medidas dividem o banco de dados em partes

iguais. Dentre os quantis podemos ter: Quartil – divide o conjunto de dados em quartos (quatro partes iguais) Ordem do quartil 9� � :������

� 9� � :������

� 9� � :������

Decil – divide o conjunto de dados em 10 partes iguais Ordem do decil ;� � :������

� ;� � :������

� ;� � :�����

1º quartil 2º quartil 3º quartil

1º decil 2º decil 9º decil ···

Page 8: Medidas de Centralidade_aula 2

8 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Centil – divide o conjunto de dados ordenados em 100 partes iguais Ordem do centil 0� � :������

� 0� � :������

� 0� � :�����

Exemplo 1: Considere os dados abaixo sobre resistência (MPa) de determinados tipos de materiais: 18 5 42 40 41 48 32 9 45 42 36 Determine os valores dos quartis Solução: Dados ordenados

y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11

5 9 18 32 36 40 41 42 42 45 48 9� � :��� ���

+9� � :���� ���

+ 9� � :��� + 9� � :� + 9� � 18

9� � :��� ���

+9� � :���� ���

+ 9� � :��� + 9� � :� + 9� � 40

9� � :��� ���

+9� � :���� ���

+ 9� � :��� + 9� � :� + 9� � 42

Exemplo 2: Determine o 1º decil e 5º centil para o tempo de sobrevivência (dias) de determinada espécie de planta: 10 22 22 23 25 27 29 29 30 32 32 33 35 35 36 37 38 38 42 43 43 44 44 45 46 47 47 48 50 54 54 56 58 61 61 92 Solução: 1º Decil ;� � :��� ��

�� + ;� � :���� ���� + ;� � :�,�

;� � :� � 0,7#:� . :�$ + ;� � 22 � 0,7 + ;� � 22,7 5º Centil 0� � :��� ��

�� + 0� � :���� ���� + ;� � :�,��

0� � :� � 0,85#:� . :� $ + 0� � 10 � 10,2 + 0� � 20,2

1º centil 2º centil 99º centil ···

Page 9: Medidas de Centralidade_aula 2

9 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Representação Gráfica – Box Plot O box plot (Figura 1) é uma representação gráfica bastante interessante, pois da uma idéia da dispersão dos dados, informa sobre sua assimetria, caudas e valores atípicos. Para a construção do Box plot desenhamos um retângulo onde são representados a mediana e os quartis. Partindo do retângulo e uma linha para cima que não exceda o limite superior (máximo) calculado por: 9� � 1,5#93 . 91$. Da mesma forma desenhamos uma linha para baixo que não exceda o limite inferior (mínimo) calculado por: 9� . 1,5#93 . 91$. Os valores acima do limite superior ou abaixo do limite inferior são conhecidos como outliers ou valores atípicos. Box Plot Para o exemplo 2 tem-se o seguinte Box plot: 9� � :��� ��

�+9� � :���� ��

� + 9� � :�,��

9� � :� � 0,25#:�� .:�$ + 9� � 30 � 0,5 + 9� � 30,5 9� � :��� ��

�+9� � :���� ��

� + 9� � :��,�

9� � :�� � 0,5#:�� .:��$ + 9� � 42 � 0,5 + 9� � 42,5 9� � :��� ��

�+9� � :���� ��

� + 9� � :��,��

9� � :�� � 0,75#:�� .:��$ + 9� � 47 � 0,75 + 9� � 47,75 "�� + " � 9� � 1,5#9�.9�$ + " � 47,75 � 1,5#47,75 . 30,5$ "�� + " � 73,625

"�� + > � 9� . 1,5#9�.9�$ + > � 30,5 . 1,5#47,75 . 30,5$ "�� + > � 4,625

Máximo

Q3

Q1

Mínimo

Mediana

25%

50%

75%

* Outlier

* Outlier

Page 10: Medidas de Centralidade_aula 2

10 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

O valor 92 do conjunto é considerado discrepante (atípico), pois está acima do ponto máximo Box Plot do tempo de sobrevivência de determinada planta

Exercícios 1) Devido a problemas com a corrosão de barras de aço em estruturas de concreto, pesquisadores testaram a aderência de barras plásticas reforçadas. Para o estudo foram feitas 50 observações sobre resistência da aderência. 16,5 15,2 9,5 17,8 13,2 6,5 5,9 12,7 14,2 9,3 12,3 5,6 6,4 7,5 10,6 12,3 9,7 15,4 9,3 14,3 13,0 8,8 7,2 12,3 13,5 14,3 10,2 11,5 9,6 15,9 8,9 9,8 15,0 5,9 6,9 12,5 11,1 13,4 8,7 9,7 10,1 9,5 15,6 9,9 7,6 4,9 4,3 12,1 11,9 16,8 a) Organize os dados em uma tabela de freqüência de amplitude de classe de 2,0 começando por 4,0. b) Construa um histograma c) Determine a media, mediana e moda

2) O índice de céu claro foi determinado na cidade de Bagdá em um estudo que compreendeu os 365 dias do ano (Contribution to the Study of the Solar Radiation Climate of Baghdad Environment”, Solar Energy, 1990, 6. 7-12). A tabela abaixo mostra os resultados obtidos: Classe Freqüência 0,15 0,25 8 0,25 0,35 14 0,35 0,45 28 0,45 0,50 24 0,50 0,55 39 0,55 0,60 51 0,60 0,65 106 0,65 0,70 84 0,70 0,75 11 a) Calcule a média aritmética b) Construa mediana c) Determine a moda

90

80

70

60

50

40

30

20

10

0

Tempo de sobrevivencia (dias)

Page 11: Medidas de Centralidade_aula 2

11 Apontamentos de Aula - Probabilidade e

3) Para facilitar um projeto de ampliação de rede de esgoto em certa região, as autoridades tomaram uma amostra de tamanho 50 dos 300 quarteirões que a compõem. E foram encontrados os seguintes números de casas por quarteirão. 2 3 3 8 916 18 19 20 2125 25 27 29 3052 57 57 60 6289 90 92 95 97a) Calcule a média aritmética b) Construa mediana c) Determine a moda 4) As notas finais de um candidato a concurso público foram: matemática, nota 8, Português, nota 7 e conhecimentos específicos, nota 9. Sabendo que os pesos de matemática, português e conhecimentos específicos são 2, 1 e 3 respectivamente determine a nota med 5) A tabela seguinte mostra o número de erros tipográficos em páginas de uma determinada cartilha. Determinar a média, mediana e moda dos erros.Número de erros 0

Número de paginas 12

6) A seleção brasileira de basquete preparoucontando com 10 atletas com media de altura de 1,90 m. Na véspera do embarque, um atleta de 2,02 m contundiupressas, um pivô de 1,92m. Determine a altura média da seleção que embarcou para o torneio. 7) Com base no gráfico determine a média anual de mortes causadas por acidentes de transito:a) no período de 1991 a 2000 b) nos últimos 3 anos

Fonte: O Estado de S. Paulo, 4/3/2001

e Estatística - Prof. Rubens A Requena

facilitar um projeto de ampliação de rede de esgoto em certa região, as autoridades tomaram uma amostra de tamanho 50 dos 300 quarteirões que a compõem. E foram encontrados os seguintes números de

9 10 12 12 14 1521 21 22 22 23 2430 30 36 40 44 4462 69 70 75 80 8397 97

As notas finais de um candidato a concurso público foram: matemática, nota 8, Português, nota 7 e conhecimentos específicos, nota 9. Sabendo que os pesos de matemática, português e conhecimentos específicos são 2, 1 e 3 respectivamente determine a nota media do candidato.

A tabela seguinte mostra o número de erros tipográficos em páginas de uma determinada cartilha. Determinar a média, mediana e moda dos erros.

1 2 4

5 3 2

A seleção brasileira de basquete preparou-se, durante quatro meses, para um torneio internacional, contando com 10 atletas com media de altura de 1,90 m. Na véspera do embarque, um atleta de 2,02 m contundiu-se e o técnico decidiu substituípressas, um pivô de 1,92m. Determine a altura média da seleção que embarcou para o torneio.

Com base no gráfico determine a média anual de mortes causadas por acidentes de transito:

facilitar um projeto de ampliação de rede de esgoto em certa região, as autoridades tomaram uma amostra de tamanho 50 dos 300 quarteirões que a compõem. E foram encontrados os seguintes números de

15 16 24 25 44 50 83 83

As notas finais de um candidato a concurso público foram: matemática, nota 8, Português, nota 7 e conhecimentos específicos, nota 9. Sabendo que os pesos de matemática, português e conhecimentos

A tabela seguinte mostra o número de erros tipográficos em páginas de uma determinada cartilha.

se, durante quatro meses, para um torneio internacional,

se e o técnico decidiu substituí-lo, convocando às pressas, um pivô de 1,92m. Determine a altura média da seleção que embarcou para o torneio.

Com base no gráfico determine a média anual de mortes causadas por acidentes de transito:

Page 12: Medidas de Centralidade_aula 2

12 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

8) A tabela abaixo fornece a quantidade de faltas registradas pelos funcionários de uma pequena empresa, durante um mês:

Número de faltas 0 1 2 3 4

Freqüência absoluta 30 18 7 3 2

a) Quantos funcionários têm a empresa? b) Determine o valor da media aritmética mediana, moda associados ao número de faltas 9) Trinta trabalhadores de um canteiro de obras foram selecionados para participarem de um treinamento de fuga do local de trabalho, como parte do programa de prevenção de acidentes do trabalho elaborado pela CIPA. O tempo de fuga dos trabalhadores (em segundos) é apontado abaixo: 360 420 356 290 305 452 251 320 374 410 525 362 283 345 423 422 352 531 420 365 234 235 342 402 493 322 374 439 292 506 a) Determine a média aritmética b) Determine a mediana c) Determine a moda

10) Em uma pequena empresa de prestação de serviços trabalham 20 pessoas. Os salários, por função, são apontados abaixo: Operários Encarregado Secretária Motorista Diretor Presidente

8 1 2 2 1 1

R$ 650,00 R$ 1.200,00 R$ 800,00 R$ 720,00 R$ 2.860,00 R$ 5.200,00