Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um...
Transcript of Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um...
Estatísticaamintas paiva
afonso
NOTAÇÃO
Característica amostra população
Somatório de um conjunto de valores
Valores individuais dos dados x i x i
Número de valores (tamanho do conjunto) n N
Média aritmética
Desvio padrão s
2s 2Variância
Range (amplitude) R -
x
Notações Estatísticas
Achatamento - curtoseAssimetria - coeficiente de assimetria
-Média aritm.-Mediana-Moda-Quartis-Percentis
-Amplitude-Variância-Desvio padrão-Coeficiente de Variação-Desvio médio
MEDIDAS ESTATÍSTICAS DISPERSÃO
POSIÇÃO tendência central
FORMAUnidade 4 Unidade 5
Não será abordado
Sínteses Numéricas
= x N
Média de todos os valores de uma população.
= x n
_Média de um conjunto de valores
amostrais.
Obs.: A média nos dá uma idéia de onde os valores do meu conjunto de dados tende a se concentrar.
Corresponde ao somatório de um conjunto de valores dividido pelo número destes valores.
Média = x n
n = número de valores
Medidas de Posição – Tendência Central
Média aritmética
Média aritmética
Exercício : Um estudante fez quatro provas e obteve as notas 89, 94, 95 e 86, a sua nota média é:
5,894
86959489
x
notação
n
xxxx n...21
n
x
n
xn
ii 1
Medidas de Posição – Tendência Central
É a mais importante das medidas de tendência central;
A média de um conjunto de números pode ser sempre calculada;
Para um dado conjunto de números, a média é única;
É sensível (ou afetada) a todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica;
Somando-se ou reduzindo-se uma constante a cada valor do conjunto, a média ficará aumentada ou reduzida dessa constante: µ(x ± k) = µ (x) ± k;
Multiplicando-se ou dividindo-se cada valor do conjunto por uma constante, a média ficará multiplicada ou reduzida por essa constante: µ(x .\ k) = µ (x) .\ k
Média aritmética
Medidas de Posição – Tendência Central
Foi introduzida recentemente nos estudos estatísticos;
Se obtém eliminando do conjunto de dados os “m” maiores e os “m” menores valores;
Média aparada
No conjunto de dados abaixo, calcular a média aparada, com m =2
1, 2, 6, 7, 6, 8, 10, 8, 12, 23, 25, 8, 9, 7, 11, 12, 13, 10, 8, 9, 7, 12, 12, 10, 9, 11,7, 8, 6, 8, 9, 10, 11, 8, 7, 11, 12, 6, 10, 9, 7, 8, 10, 6, 7, 12, 8, 9, 10,
Normalmente m correspondente: 2,5% a 5% dos valores observados;
Na verdade o que se está fazendo é eliminando os valores extremos superiores e inferiores (valores discrepantes - outliers);
Medidas de Posição – Tendência Central
Média aparada
0
5
10
15
20
25
30
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49
A média aparada exclui valores discrepantes
A média aritmética de todos os valores é = 9,29Excluindo os dois menores e dois maiores valores (1, 2, 23 e 25), a média aparada é = 8,98
Medidas de Posição – Tendência Central
Cada elemento do conjunto pode ter importância diferente (peso). Neste caso o cálculo da média deve levar em conta os pesos desiguais de cada elemento.
Exercício : O colégio definiu que as provas mensais teriam peso de 30% e a prova final teria peso de 40% no cálculo dos rendimentos dos alunos. Veja o quadro abaixo e calcule a média do aluno.
Média ponderada
800,30
0,30
Mês 2 9096
exame nota pesoMês 1
Final 0,40
=0,3*80 + 0,3*90 + 0,4*96
0,3 + 0,3 + 0,489,4px
Medidas de Posição – Tendência Central
Média ponderada
Notação
n
nnp ppp
pxpxpxx
...
...
21
2211p1, p2....pn são os pesos
n
ii
i
n
ii
p
p
pxx
1
1
Medidas de Posição – Tendência Central
A Mediana de um conjunto de valores é o valor do meio desse conjunto, quando estes estão em ordem crescente.
Divide um conjunto de dados ordenados em dois grupos iguais.
3, 7, 5, 5, 1, 9, 15, 13, 17, 13, 17Dado o conjunto de 11 dados:Calcule a mediana.
Exercício
5 dados
11, 13, 13, 15, 179,Conjunto dados ordenados
5 dados
1, 3, 5, 5, 7,
Valor central = mediana
Mediana x~
Medidas de Posição – Tendência Central
Mediana x~
Conjunto de valores pares ( n = par)
+ = valorn/2 (n / 2) + 1
valor )( / 2x~
Conjunto de valores impares (n = impar)
= valor(n+ 1) / 2
x~
5,82/)107(2/)32(~ posiçãovalorposiçãovalorx
5, 7, 10, 11, 14 n = 5
10=3=~ posiçãovalorx
exemplo
= valor (5+1)/2 = valor 3x~
x~= (valor 4/2 + valor (4/2 + 1))/2
5, 7, 10, 11 n = 4 exemplo
Medidas de Posição – Tendência Central
Exercício: Calcular a mediana das medidas de um conjunto de eixo:
(3,0 ; 2,8 ; 2,9 ; 3,3 ; 3,5 ; 3,1 ; 3,2 ; 3,0 ; 3,4 ; 2,7)
(2,7 ; 2,8 ; 2,9 ; 3,0 ; 3,0 ; 3,1 ; 3,2 ; 3,3 ; 3,4 ; 3,5)
Resolução:
Mediana = x~ 3,0 + 3,1 2
= = 3,05
Interpretação do resultado: 50% dos dados brutos são valores menores ou iguais a 3,05 e 50% desses são valores maiores ou iguais a 3,05.
Medidas de Posição – Tendência Central
Mediana x~
Média aritmética MedianaX
Salário dos funcionários de um restaurante
200, 250, 250, 300, 450, 460, 510 7,3457
510460450300250250200
x
A média de 345,7 sintetiza razoavelmente o conjunto de dados (salários)
Salário dos funcionários incluindo o gerente
200, 250, 250, 300, 450, 460, 2300 4,601=7
2300+460+450+300+250+250+200=x
A média de 601,4 não sintetiza razoavelmente o conjunto de dados
Nos dois casos a mediana é 300. Para o segundo caso a mediana representa melhor o conjunto de dados.
Num conjunto de dados fortemente desviado, a mediana é uma medida mais representativa (distribuição de rendas, folha de pagamentos)
Medidas de Posição – Tendência Central
Moda - MO
A Moda de um conjunto de valores é o valor que apresenta maior freqüência em um conjunto de observações.
É o valor ou classe de maior freqüência num conjunto de dados.
- pode não existir
- pode não ser única
Exercício : Dado o conjunto de dados 10, 10, 11, 14, 15, 16, 17, 18, 18. Calcule a moda.A moda é constituída de dois valores: MO = 10 e 18 (duas vezes cada)
Medidas de Posição – Tendência Central
medida definição quão
freqüente
existência considera todos
valores?
afetada pelos
valores extremos
vantagens e desvantagens
média “média” mais familiar
existe sempre
sim sim muito utilizada em estatística
mediana Valor
médio
usada existe sempre
não não costuma ser boa escolha se há valores extremos
moda valor mais freqüente
usada às vezes
pode não existir; pode ter mais de uma moda
não não apropriada para dados ao nível nominal
x = xn
COMPARAÇÃO
Medidas de Posição – Tendência Central
Exercício:
Inspecionaram-se quinze rádios antes da remessa e os números de defeito por unidade são apresentados no quadro abaixo:
1 4 0 2 10 2 3 0 03 1 1 1 1
Números de defeito por rádio
Encontre a média, a mediana e a moda do número de defeitos.
Resposta: (média = 1,33) (mediana = 1) (moda =1).
Medidas de Posição – Tendência Central
A dispersão mede quão próximo uns dos outros estão os valores do grupo
pequena dispersão
grande dispersão
3131
46,39,30,23,1737,34,31,28,25
BA xx
BA
A variabilidade de B é maior que de A
Uma medida de posição
(quase sempre a média)
Uma boa representação de dados
Uma medida de dispersão
(quase sempre o
desvio padrão)
= +
Medidas de Dispersão
Amplitude, range ou intervalo
É expresso pela diferença entre o maior e o menor valor num grupo, ou pela identificação desses dois números.
númerosintervalo
diferença do menor ao maior(1 ; 5 ; 7 ; 13)
(14 ; 3 ; 17 ; 4 ; 8 ; 73 ; 36 ; 48)
(3,2 ; 4,7 ; 5,6 ; 2,1 ; 1,9 ; 10,3)
13 – 1 = 12
73 – 3 = 70
10,3 – 1,9 = 8,4
de 1 a 13
de 3 a 73
de 1,9 a 10,3
Medidas de Dispersão
Amplitude, range ou intervalo
••••
•••
•
LIMITAÇÃO: só leva em conta os dois valores extremos do conjunto, nada informando sobre os outros valores.
•• •• •• • •• •
• ••••
• •••• ••
intervalo
1
2
3
distribuição uniforme – o intervalo é uma boa medida
é uma medida apenas razoável
é uma medida ruim da dispersão
Medidas de Dispersão
Desvio médio absoluto
DMA =
| x i – x |n
DMA é fácil de entender e calcular
mas é pouco usado como medida de dispersão
outras medidas apresentam propriedades matemáticas mais interessantes
Medidas de Dispersão
Exercício: Calcule o DMA do conjunto de dados 2, 4, 6, 8, 10. Calcular o desvio médio.
X = (2 +4 +6 +8 +10) / 5 = 6
Desvio médio absoluto
Xi - X
2 – 6 = - 4 4 – 6 = - 2
6 – 6 = 0
8 – 6 = 2
10 – 6 = 4
0soma
DMA = (4 +2 +0 +2 + 4 ) / 5 = 2,4
DMA = | x i – x |
n
Medidas de Dispersão
Variância
A Variância é uma medida de dispersão muito utilizada.
S x2 = n - 1
(x i - x )2
n – 1 amostran população
ATENÇÃO
S x2 =
n - 1
( x i )2 / n x i2 -
OU
Medidas de Dispersão
Variância
Exercício: Calcule a variância da amostra 2, 4, 6, 8, 10.
A média desse conjunto é 6.
6
6 + 2
4
4
x i x x i - x (x i - x ) 2
2468
10
6
6
- 46- 2
0
+ 4
0
16
16
somas 0 40
40S x2 = n - 1
(x i - x )2
=5 - 1
= 10
Se esses valores representassem toda a população, a variância seria 40/5 = 8.
Medidas de Dispersão
Desvio padrão
O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise. Assim, se a unidade da variável for mm, o desvio padrão também será mm.
Isso não acontece com a variância.
S x = n - 1 (x i - x )2
S x = n - 1
( x i )2 / n x i2 -
n – 1 amostra
n população
só raiz positiva da variância
É a raiz quadrada da variância.
Medidas de Dispersão
Desvio padrão
O desvio padrão é a medida de dispersão mais usada. Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média.
s = 3
1 2 3 4 5 6 7
s = 1,0
1 2 3 4 5 6 7
s = 0,8
1 2 3 4 5 6 71 2 3 4 5 6 7
freq
üênc
ia
s = 076543210
O desvio-padrão cresce quando a dispersão dos dados aumenta
4
7
Xmédiacom
medidastemoscasosostodosem
Medidas de Dispersão
Coeficiente de variação
É a relação entre o desvio padrão e a média do conjunto de dados.
Nos dá a idéia do tamanho do desvio padrão em relação à média.
Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável
CV (%) = S x
x. 100
Conjunto de dado com s = 15 e média 100
CV = 15%
Conjunto de dado com s = 20 e média 1000
CV = 2%
σCV(%) =
µ. 100ou
amostra população
Medidas de Dispersão
Exemplo: Calcular o desvio-padrão da amostra representada por: 1, 2, 4, 5, 7.
i Xi (Xi - X ) (Xi - X )2 1 1 (1 – 3,8) = -2,8 (-2,8)2 = 7,84 2 2 (2 – 3,8) = -1,8 (-1,8)2 = 3,24 3 4 (4 – 3,8) = 0,2 (0,2)2 = 0,04 4 5 (5 – 3,8) = 1,2 (1,2)2 = 1,44 5 7 (7 – 3,8) = 3,2 (3,2)2 = 10,24 X = 3,8 8,22
5
1
2 XX i
Médias e Desvio-padrão - Exemplos
39,24
8,228,22.
15
1.
1
12
n
ii XX
nS
Logo :
i Xi (Xi - X ) (Xi - X )2 1 1 (1 – 3,8) = -2,8 (-2,8)2 = 7,84 2 2 (2 – 3,8) = -1,8 (-1,8)2 = 3,24 3 4 (4 – 3,8) = 0,2 (0,2)2 = 0,04 4 5 (5 – 3,8) = 1,2 (1,2)2 = 1,44 5 7 (7 – 3,8) = 3,2 (3,2)2 = 10,24 X = 3,8 8,22
5
1
2 XX i
Médias e Desvio-padrão - Exemplos
Exercício 1: Vamos supor que eu quero comprar uma lâmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida útil de suas lâmpadas e eles me fornecem os seguintes dados:
Fabricante A (h) Fabricante B (h) 730 1000 710 687 705 700 720 850 765 587 750 710
Supondo que as duas lâmpadas custam o mesmo valor, qual delas eu deveria comprar?
Médias e Desvio-padrão - Exercícios
Para chegarmos à uma conclusão é necessário calcularmos o tempo de vida útil médio para cada fabricante e saber qual é variabilidade dos dados.
hX A 730 hX B 67,755SA = 23,45 h
SB = 146,25 h
Critério de escolha: tempo de vida útil = média desvio-padrão
Fabricante A (h) Fabricante B (h) 730 1000 710 687 705 700 720 850 765 587 750 710
Médias e Desvio-padrão - Exercícios
Fabricante A : 730 ± 23,45 h
hX A 730hSX AA 45,23730 hSX AA 45,23730
Fabricante A:[706,55 – 753,45= -46,9]
Fabricante B : 755,67 ± 146,25 h
hSX BB 25,14667,755 hSX BB 25,14667,755 hX B 67,755
Fabricante B : [609,42 – 901,92= -292,5]
Conclusão : Escolheria o fabricante A.
Médias e Desvio-padrão - Exercícios
Exercício 2: Um comerciante está interessado em comprar 100 garrafas de cachaça para o seu estabelecimento. No entanto, como é de preferência de sua clientela, é necessário que a cachaça escolhida apresente um teor alcoólico de no mínimo 33% em volume. Ele consultou alguns fornecedores e obteve as seguintes informações:
Teor alcoólico de três tipos de aguardente pesquisadas. Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)
38,7 35,7 38,7 33,5 36,4 33,5 32,5 35,9 34,5 31,2 33,2 34,2 35,9 34,1 35,9
Na sua opinião, qual deveria ser a marca escolhida pelo comerciante?
Médias e Desvio-padrão - Exercícios
Marca A: 34,36 ± 2,97 [31,39–37,33=-5,94]
Marca B: 35,06 ± 1,35 [33,71–36,41=-2,7]
Marca C:35,36 ± 2,06 [33,3–37,42=-4,12]
As marcas B e C atendem ao requisito (>33%),no entanto escolheria a marca C pelo preço. Assim, teria um economia de R$ 45,00!
Teor alcoólico de três tipos de aguardente pesquisadas. Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)
38,7 35,7 38,7 33,5 36,4 33,5 32,5 35,9 34,5 31,2 33,2 34,2 35,9 34,1 35,9
Médias e Desvio-padrão - Exercícios
www.matematiques.com.bramintas paiva
afonso