Post on 12-Feb-2019
Cálculos estatísticos amostrais simples
1. Parâmetros (ou medidas) de posição (localização central):
�A) Média aritmética ( ):
�B) Mediana ( ): É o elemento do meio (central), quando o número dedados n é ímpar, ficando 50% dos dados para cada lado da mediana.
�Exemplo: Dadas as medições de uma característica de uma peça, emmm: 35 / 39 / 39 / 40 / 45 / 46 / 46,5 (n = 7, que é um número ímpar dedados), calcular a média e a mediana.
�Obs.: Se n for par, a mediana é a média dos 2 valores centrais.
�A mediana é mais fácil de calcular, mas é mais imprecisa (recomenda-seusar a média, nas cartas de controle). A mediana devia ser usada só emdistribuições muito assimétricas.
X
X~
(meio) mm 40X~
=
nX
X i∑=
41,5mmdados) de (número 7
dados) dos (soma 290,5X ==
Cálculos estatísticos amostrais simples
2. Parâmetros (ou medidas) de dispersão (variabilidade):
�A) Amplitude total ou Range (R), que é mais fácil de calcular, mas temmaior imprecisão, sendo usado só para pequenas amostras (n ≤ 5):
�B) Desvio padrão (S), que é mais difícil de calcular (usar calculadora?),mas tem maior precisão (recomenda-se usar este indicador, nas cartasde controle):
�No exemplo do slide anterior, em que a média era 41,5 mm, temos:
R = 46,5 – 35,0 = 11,5 mm
[ ]22
i
2
iXn.X.
1n
1
1n
)X(XS −
−=
−
−= ∑∑
menormaior XXR −=
4,37mm17
41,5)(46,5...41,5)(3941,5)(35S
222
=−
−++−+−=
Para se caracterizar bem uma distribuição estatística de dados, deve-se usar pelo menos um parâmetro de posição e pelo menos um de dispersão!!!
Exatidão e precisão
� Consideremos: = média do processo e M = média nominal dada pelo cliente.
� A expressão exatidão ocorre quando e precisão quando a variação do processo,dada pelo desvio padrão, é pequena.
MX ====
MX ====
X
MX ====
X
M
M
MX ====
X
MX ====
X
X
Exato e não precisoExato e preciso
Não exato e preciso Não exato e não preciso
MX ====
MX MX
MX ====
S
S S
S
Exatidão e precisão
� As figuras tentam simular um exercício com tiro ao alvo, sendo que, cada quadradomostrado, indica a posição atingida com um tiro. Comparemos com os conceitos deexatidão e precisão, que vimos no slide anterior.
Bem centradoPouco disperso
Mal centradoPouco disperso
Bem centradoMuito disperso
Mal centradoMuito disperso
Pequena dispersão
Grande dispersão
Distribuição de dados
� Para se representar bem uma distribuição de dados numéricos medidos,pode-se lançar mão de três mecanismos:
�Tabela simples de dados (ou Rol), onde os valores são mostrados naordem de obtenção, que se torna muito grande, à medida que sãocoletados mais e mais valores, dificultando a visualização.
�Tabelas de freqüências, nas quais os dados coletados são agrupadosem faixas de variação (ou classes) e, anota-se, para cada classe, aquantidade de valores encontrados (freqüência).
�Histograma, que é um gráfico construído a partir de uma tabela defreqüência, contendo as mesmas informações, mas com melhorvisualização (“uma imagem, ....”).
�Parâmetros representativos, que são conjuntos de parâmetros,característicos dos dados coletados, contendo pelo menos um tipo deposição e pelo menos um tipo de dispersão; eles podem ser:
• Posição: média, mediana, quartis, etc;
• Dispersão: amplitude total, desvio padrão, variância, etc;• Forma: indicadores de assimetria e curtose.
Elaboração de um histograma
� Coletar N dados da variável em estudo (ideal: N ≥ 80).
� Calcular a amplitude total, ou range (R):
� Calcular o número de classes (K):
Obs.: cálculo de K, com menos precisão:
� Calcular a amplitude das classes (H):
� Escrever as classes e anotar, para cada uma, o número de valores
observados (freqüência absoluta - Fi).
� Fazer a tabela de freqüências (Fi = absoluta, FRi = relativa, FAi = acumulada,
FRAi = relativa acumulada).
� Posteriormente, construir o histograma. Os.: Estes cálculos podem ser feitos,
automaticamente, por softwares, como o Excell e o Minitab (recomendado).
R = Xmáx – Xmín
K = 1 + 3,3 . log N
H = R / K
NK =
Tabelas de freqüências
Tabela mostra resultados de um grande levantamento de dados, distribuídos em faixas de variação (classes), que dará origem ao histograma.
20 30 = 20 inclusive até 30 exclusive (classe)
100200255060 70
75150408050 60
3570204040 50
30102030 40
1051020 30
FAiFRi (%)Classes Fi
15
5
FRAi (%)
Freqüências:
Fi= absoluta
FRi= relativa
FAi= acumulada
FRAi= relativa. acumul.
Histograma
Xi
3,5
4,4
5,3
6,2
4,4
5,3
6,2
7,1
7,1
8,0
0,8
1,7
1,7
-2,6
2,6
3,5
Fi
- -- - -- -
LIE = 0,7 LSE = 6,8
K = 8 classes, cada uma com amplitude H = 0,9 (1,7 – 0,8)
R = 8,0 – 0,8 = 7,2 (amplitude total)
LIE e LSE = limites de especificação (cliente)
Curvas de freqüências
� Representam um “histograma teórico”, numa condição limite em quea quantidade de dados é extremamente grande (tendendo a infinito).
Curva simétrica (forma de sino)
Fi
Xi
Fi
Xi
Diferentes tipos decurvas simétricas
alongada intermediária
achatada
Fi
XiCurva assimétrica à esquerda Curva assimétrica à direita
Fi
Xi
� Assimetria�Analisa a diferença entre média, mediana e moda (valor que tem a maior
freqüência, ou seja, o ponto de máximo da curva de freqüência).�Se eles forem iguais, a distribuição é simétrica.�Sendo diferentes, a distribuição é assimétrica, sendo essa assimetria à
direita (média > moda) ou à esquerda (média < moda).
�Coeficiente de assimetria α3 (skewness, no Minitab): α3 = 0 (simetria),α3 > 0 (assimetria à direita), α3 < 0 (assimetria à esquerda)
� Curtose
�Mede o grau de achatamento de uma distribuição simétrica, ou seja, se adistribuição é alongada, intermediária (ou normal), achatada.
�Coeficiente de curtose α4 (kurtosis, no Minitab): α4 = 0 (normal),α4 > 0 (alongada), α4 < 0 (achatada).
�Obs.: Esses conceitos podem ser visualizados, no slide anterior.
�Não recomendamos seus cálculos através das fórmulas, à mão, pelagrande dificuldade, daí estarmos indicando o Minitab (será visto à seguir).
Assimetria e Curtose
Curva da Distribuição Normal (Gauss)
� Gauss, propôs, há cerca de 150 anos atrás, que os valores de medição de uma dadacaracterística, tendem a uma distribuição, com um aspecto assemelhado com o dafigura, lembrando uma função exponencial, se o processo de trabalho for estável.Mais tarde, tendo sido validada essa conclusão, a curva de Gauss foi denominadaNormal, dado o fato de ser a mais normalmente encontrada na prática.
� O cálculo dos percentuais sob a curva foi tabelado, a partir da expressão: zi = (xi –x)2/S,chamada de escore reduzido da Distribuição Normal Tabela – Módulo complementar).
� Essa distribuição, teórica, é simétrica (média aritmética e mediana são iguais) e tem umaspecto de sino, sendo definida por 2 parâmetros: média e desvio padrão.
99,994%
99,73%
95,44%
68,26%
+1S
+2S
+3S
+4S
- 1S
- 2S
- 3S
- 4S
X
A figura mostra alguns percentuais sob a curva,
quando nos afastamos 1 ou 2 ou 3 ou 4 desvios padrões da
média (valor central), que serão importantes quando formos
interpretar as cartas de controle.
PPN = Papel de Probabilidade da Normal
�Objetivo: Analisar a eventual normalidade de um conjunto de dados.
�Construção: Plotar FRA, no eixo vertical, e os pontos médios das classes, Xi, no eixo horizontal (método trabalhoso e pouco preciso).
�Se der uma linha reta perfeita, os dados seguem uma distribuição Normal (teórica).
�Tendendo a uma reta, com pouca dispersão, temos uma distribuição Normal aproximada, podendo-se traçar uma reta média (estimada).
�O valor de Xi correspondente a FRA de 50% será a média (µ) e, de forma similar tem-se o desvio padrão (σσσσ), com ≅ 87%.
�O software Minitab constrói esse gráfico, com maior precisão (será visto depois).
FR
A(%
)
Pontos médios das classes
µµµµ
σσσσ
Apresentação do Minitab
� O Minitab é um dos melhores softwares estatísticos do mercado, estando já nasua versão 15.1 (mais atual). Ele tem o CEP como uma das opções de menu.
� Apesar de seu preço de compra não ser tão baixo, existe uma versão demo,free, que pode ser obtida na internet, com o endereço “minitab.com”, sendoválida por 30 dias (suficiente para conhecê-la). Vencido o prazo, para obter denovo, só em outra máquina.
� Nele, os dados a serem analisados são digitados numa planilha, semelhante àdo Excell, sendo que esses dados devem estar empilhados numa únicacoluna (default). A maioria dos comandos de seu menu (abrir, salvar, imprimir,copiar, colar, recortar, etc) é semelhante aos do Excell, facilitando seu uso.
�Vamos apresentar, a partir de agora, seus pontos e aplicações mais importantes, para uso no CEP (não será uma apresentação exaustiva).
�Vale acrescentar que o Minitab “conversa” com todos os itens do Office, da Microsoft, permitindo importar e exportar dados, por exemplo.
Janela de sessão e planilha
� Session (Janela de sessão): mostra adata e a hora da abertura do programa,além de uma mensagem de boas vindas,e tem por finalidade apresentar todos osresultados dos cálculos.
� Workshotsheet (Planilha): semelhanteao Excell, com linhas numeradas (1, 2, 3,etc) e colunas (C1, C2, C3, etc). Nela aprimeira linha, de cor cinza, é utilizadaapenas para se colocar textos (títulosindicativos dos dados da coluna).
� Nessa linha cinza poderá aparecer(espontaneamente), uma letra T,caracterizando que os dados digitados namesma representam textos, ou uma letraD, indicando que os dados são de datas(dias, meses, anos, etc). Nãoaparecendo nenhuma letra, significa quea coluna só tem dados numéricos.
Menus: Arquivo (File) e Editar (Edit)
� File (Arquivo) - Permite: Novo, Abrir, Salvar, Salvar como,Imprimir, Exportar e Importar (projetos, planilhas e gráficos),usando os comandos copiar/colar e, dessa forma, manipulararquivos.
� Edit (Editar) – Permite:Limpar células, deletar,copiar, recortar, colar, etc.
Menu: Dados (Data)
� Data (Dados) – Permite manipular dados: separar, fundir erefundir dados, empilhar (stack) e desempilhar colunas, transporcolunas (de horizontal para vertical), ordenar direta eindiretamente (sort), mudar o tipo de dado (ex.: texto paranúmero), etc.
Stack columns (Empilhar dados) - Janela da esquerda (stackcolumns, que aparece em quase todas as telas do Minitab), mostra as colunas que contém dados, a Janela superior (stack the followingcolumns) para selecionar as colunas a empilhar e sua parte inferior as condições para onde armazenar os dados empilhados (store stacked).
Colunas que se pode empilhar
Colunas escolhidas
Destinos escolhidos
Menu: Cálculos (Calc)
� Calc (Efetuando cálculos) – Este menu tem uma funçãocalculadora, semelhante à do Excell, e permite, ainda:fazer algumas estatísticas de coluna e de linha, gerardados aleatórios (random data), segundo escolha de umadistribuição, calcular distribuições de probabilidades.
� Calculator (Função calculadora) – A janela da esquerda permite selecionar colunas, a janela superior (store result) permite escolher coluna onde se quer armazenar resultados e a janela central, para criar uma expressão de cálculo.A janela inferior (functions) contém
várias funções, que podem ser usadas para criar a expressão.
Menu Calc: Estatística de colunas e geração de dados aleatórios de uma Normal
Column statistics (Estatística de colunas) -Indicar a estatística desejada, uma por vez, nas janelinhas (statistic) e selecionar a variável de interesse, que está na janela da esquerda, para a janela central (input variable).
Gerar dados aleatórios, de uma Normal -Indicar o número desejado de dados (janela generate rows), a coluna onde se quer colocar esses números (store), e fornecer valores para a média (mean) e para o desvio padrão (standard deviation).
Neste caso, queremos a soma, da coluna C1 (largura)
Menu: Cálculos estatísticos (Stat)
�Estatística básica (Basic statistics), que contém: estatística descritiva, sumário gráfico, intervalos de confiança, testes de hipótese, correlação e teste de normalidade.
�Análise de regressão (Regression), que contém: regressão linear (regression) e não linear (fitted line plot).
�Análise da variância (ANOVA), que contém: análise com 1 fator (one way) e com 2 fatores (two way), além de um teste de igualdade de variâncias (test for equal variances).
�Delineamento de experimentos (DOE), que contém: análise fatorial (factorial) e método de Taguchi.
�Cartas de controle do CEP (Control charts), que contém: várias cartas, para sub-grupos, para valores individuais e para atributos, além de outras cartas especiais (2ª. edição).
�Ferramentas da qualidade (Quality tools), que contém: gráfico de tendência (run chart), Pareto, espinha de peixe (cause and effect), análises de capacidade (capability analisys / capability sixpack), estudos de MSA (gage study).
Para cada opção, existem vários sub-tipos.
Menu: Construir gráficos (Graph)
�Diagrama de dispersão/correlação (Scatter plot))
�Matriz de dispersão (Matrix plot)
�Histograma (Histogram)
�Diagrama em caixa (Box plot)
�Gráfico em coluna (Bar chart)
�Gráfico setorial, ou “pizza” (Pie chart)
�Diagrama de série de tempo (Time series plot)
�Diagrama de área (Area graph)
�Diagrama de dispersão em 3 dimensões (3D scatterplot)
Para cada opção, existem vários sub-tipos.
Minitab: Gráfico de Pareto
Stat / Quality tools / Pareto chart
Escolher coluna, com tipos de
defeitos, indicada na janela da
esquerda (Pareto chart)
Escolher coluna, com
quantidades de defeitos, ou
custos, indicada na janela da
esquerda
�Na planilha, deve-se preencher/digitar pelomenos 3 colunas, com os dados (itens,freqüências obtidas desses itens, respectivoscustos (unitários e/ou totais).
�Utilidade do Pareto: fazer priorizações,sendo ferramenta auxiliar do CEP.
Pareto - Exemplo
C.Total 280,0 160,6 136,2 131,1 119,2 112,5 71,8
Percentual 27,7 15,9 13,5 13,0 11,8 11,1 7,1
% acumul. 27,7 43,6 57,0 70,0 81,8 92,9 100,0
Defeitos
Porosidade
Rebarba
Mancha
Furo grande
Risco
Ovalização
Resistência
1000
800
600
400
200
0
100
80
60
40
20
0
C.Total
Percentual acumulado
Pareto dos Defeitos
Minitab: Diagrama Espinha de Peixe
Stat / Quality tools / Cause and effectIndicar colunas das causas (1 para cada
“M”: mão de obra, máquina, método,
medição, material, meio ambiente, etc)
Efeito e Título
Sub-causas, para cada
“M” (opcional)
Espinha de peixe - Exemplo
Sucata
M.A.
MED.
MET.
M.P.
Maqu.
M.O.
Destreinada
Desmotiv ação
Falta
Sem. prev ent.
V elha
Dureza alta
A lta %S
Baixa %C
Umidade
A utoritarismo
Proc. v elho
Sem I.T.
Sem MSA
Lay out ruim
Falta luz
F alta cultura
Falta tempo
Falta tempo
Falta $
Causas da sucata - Abril/2009
Histograma
Graph / Histogram
Insira aqui a coluna com os dados
Escolher uma opção:
• Simples;
• Com ajuste;
• Linha externa e grupos;
•Ajuste e grupos.
Histograma
Frequency = FiPercent = FRi
Frequency, Accumulate = FAiPercent, Accumulate = FRAiOpção de traçar
linhas no gráfico
Opção de adicionar textos ao gráfico
Estudo da normalidade
Indicar variável
Melhor
Stat > Basic statistics > Normality test > Anderson Darling
Normal aproximada, quando Pvalue ≥ 0,05 (empírico)
Normal perfeita: Pvalue = 1
151413121110987
99,9
99
95
90
80
7060504030
20
10
5
1
0,1
Peso
Percentual acumulado (FRA)
Média 11,21
D.Padrão 1,135
N 200
P-Value <0,005
Plotagem de probabilidade do Peso (PPN)
Histograma e Normalidade - Exemplo
Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5 Amostra 6 Amostra 7 Amostra 865,25 65,39 70,94 67,83 64,38 69,53 72,38 78,0668,26 73,65 67,45 80,44 74,49 68,89 66,09 62,0758,74 71,33 69,66 67,46 72,22 79,50 65,40 68,4766,74 71,41 68,22 73,41 79,29 66,86 64,47 74,5958,62 69,47 67,19 67,65 72,92 81,34 71,90 63,46
Amostra 9 Amostra 10 Amostra 11 Amostra 12 Amostra 13 Amostra 14 Amostra 15 Amostra 1667,66 71,41 69,33 71,06 75,30 75,74 68,20 73,8867,35 68,73 67,80 70,29 68,47 71,07 64,41 68,8172,23 77,42 71,61 69,79 66,91 67,55 72,50 72,6275,57 69,83 62,38 78,70 67,27 69,03 78,05 74,9176,55 81,18 71,09 63,55 64,63 76,00 62,77 74,09
Amostra 17 Amostra 18 Amostra 19 Amostra 20 Amostra 21 Amostra 22 Amostra 23 Amostra 24 Amostra 2575,88 70,09 69,30 70,21 65,99 69,00 77,53 67,90 71,5872,26 69,37 72,86 55,93 63,95 60,89 60,29 72,08 71,7871,02 79,64 72,90 60,37 77,16 61,80 69,45 69,58 65,1768,27 68,94 72,88 69,31 74,38 65,48 66,55 65,23 70,1264,97 74,10 71,86 73,45 75,43 69,66 73,90 71,98 72,21
Medição do diâmetro de uma peça (mm), com micrômetro de 8% de
RR (característica crítica), em 25 amostras horárias, com 5 peças
cada (dados em Excell).
Dados são exportados para o Minitab e empilhados numa
única coluna (C1), e os nºs dasamostras na coluna C2
Sugestão: tentar resolver este exemplo, usando as fórmulas
dadas, à mão, e comparar seus resultados com os do Minitab,
que mostraremos a seguir.
Histograma e Normalidade - Exemplo
Histograma, com 125 dados, divididos em 10 classes, cada uma com
amplitude 3mm (H), tendo média de 70,03mm, desvio padrão de 4,97mm e amplitude total de 30mm (R = 84 – 54)
Os 125 dados, plotados no PPN (papel de probabilidade da Normal),
com baixa dispersão em torno da linha média, com um ótimo valor de Pvalue (≥ 0,05), caracterizando pois
uma distribuição Normal.
85807570656055
99,9
99
95
90
80
7060504030
20
10
5
1
0,1
Diâmetro
FRA (%)
Média 70,03
D.Padrão 4,967
N 125
P-Value 0,847
PPN do Diâmetro
847872666054
35
30
25
20
15
10
5
0
Diâmetro
Frequência
Média 70,03
D.Padrão 4,967
N 125
Histograma do Diâmetro
� O Minitab prepara, na Janela de Sessão, um relatório com diversos parâmetros amostrais e alguns gráficos (opção 1), além do sumário gráfico, já mostrado (opção 2).
Stat / Basic statistics / Display descriptive statistics (opção 1)
Colunas com os dados
Gráficos disponíveisEstatísticas disponíveis
Stat / Basic statistics / Graphycalsummary (opção 2)
Minitab – Estatística básica
Minitab – Estatística descritiva
Stat / Basic statistics / Display descriptive statistics
Estatísticas (Statistics) Gráficos (Graphs)
Estatísticas mais usadas
Gráficos mais usados
Estatística descritiva - Exemplo
85
80
75
70
65
60
55
Diâmetro
Boxplot do Diâmetro
Máximo = 81,34mm
Quartil 3 = 72,91mm
Mediana = 69,63mm
Quartil 1 = 67,22mm
Mínimo = 55,93mm
* = possível causa especial
Sumário gráfico - Exemplo
� Quando não se tem Normal, fazer o Sumário Gráfico, para ver se os dados seguem uma distribuição alongada (Assimetria = Skewness ≅ 0 e Curtose = Kurtosis > 0).
Stat > Basic statistic > Graphycal summary
847872666054
Mediana
Média
71,070,570,069,569,0
Quartil 1 67,228
Mediana 69,663
Q uartil 3 72,910
Máximo 81,342
69,152 70,910
69,001 71,089
4,418 5,673
P-V alue 0,847
Média 70,031
D.Padrão 4,967
A ssimetria -0,0810985
C urtose 0,0953710
N 125
Mínimo 55,932
Teste de normalidade de A nderson Darling
Interv . conf. da média popul. (95%)
Interv . conf. da mediana popul. (95%)
Interv . conf. do d. padrão popul. (95%)
Intervalos de confiança (95%)
Sumário gráfico do Diâmetro
Dados amostrais (estatística descritiva)
Dados populacionais
(estatística indutiva)
Assimetria ≅ 0 e curtose > 0
Exemplo do diâmetro (cálculos à mão)
� R = 81,34 – 55,93 = 25,41mm (amplitude total ou range)
� K = 1 + 3,3.log 125 ≅ 8 classes H = 25,41/8 = 3,20 ≅ 3,5mm (amplitude de classe)
Classes 55,5/59,0 59,0/62,5 62,5/66,0 66,0/69,5 69,5/73,0 73,0/76,5 76,5/80,0 80,0/83,5Frequ. 3 6 16 34 36 17 10 3
[ ] 4,98125.70,03616103,46.124
1S
2=−=
83,576,569,562,555,5
40
30
20
10
0
Diâmetro
Frequência
Média 70,03
D. Padrão 4,967
N 125
Histograma�Média = 8753,89 / 125 ≅ 70,03mm onde: ΣXi = 8753,89
�D. Padrão =
onde: ΣXi2 = 616103,46
�Obs: notar que existem pequenas diferenças, em relação ao Minitab, pois as fórmulas, citadas nos slides 2, 3 e 4, são apenas aproximadas.