Post on 17-Apr-2015
Estatística – Conteúdo Programático• Conceitos básicos de Estatística e suas aplicações
• População, amostra, variáveis aleatórias
• Distribuição de freqüência
• Gráficos e séries estatísticas
• Medidas de Tendência Central:
• Separatrizes
• Medidas de dispersão e assimetria
• Probabilidade
Estatística – Bibliografia• SILVA, ERMES MEDEIROS DA. Estatística: para os cursos de
Economia, Administração e Ciências Contábeis. v.1 São Paulo: Altas, 2008
• KAZMIER, LEONARD J. Teoria e problemas de Estatística aplicada à Administração e Economia. Porto Alegre: Bookaman, 2007
• MORETIN, LUIZ GONZAGA, Estatística Básica:Probabilidade. São Paulo: Makron do Brasil
• LEVINE, DAVID M.;BERENSON, MARK L.; STEPHAN, DAVID. Estatística: Teoria e Aplicações:usando Microsoft Excel em português. LTC – Livros Técnicos e Científicos:Rio de Janeiro, 2000
• CRESPO, ANTONIO ARNOT, Estatística Fácil, ed.18, Saraiva:São Paulo, 2006.
Estatística – Bibliografia• STEVENSON, WILLIAM J. Estatística aplicada à Administração.
Harbra: São Paulo, 2001
• LARSON, RON; FARBER BETSY, Estatística Aplicada, 2 ed., Pearson Education do Brasil : São Paulo, 2004
• MONTGOMERY, DOUGLAS C. Introdução ao controle estatístico da qualidade. Rio de Janeiro: LTC, 2004
• ANDERSON, DAVID R.;SWEENEY, DENNIS J.;WILLIAMS, THOMAS A. Estatística aplicada à Administração e Economia. Cengage Learning: São Paulo, 2008.
ESTATÍSTICA ?
PRA QUÊ ?
ESTATÍSTICA• Exemplo:
• Bolsa fechou em alta de 3,12 % com a Vale
• Dólar cai para R$ 2,287
http://www.uol.com.br
(disponível em 8/ago/2013)
• Dívida do BNDES com o Tesouro em BILHÕES DE REAIS
2007 ........... 7 Bi
2010 .......... 237 Bi
2013 .......... 379 Bi
Revista Veja, edição 2329 nº 28 de 10/06/2013
ESTATÍSTICA - sentido comumSegundo DPVAT: 60.752 mortos no trânsito em 2012
Contra 57.116 em 2007
50.780 em 2010
Dos mortos em 2012:
-41% tinham entre 18 e 34 anos = 2x (mortes Boate
Kiss) por semana
Em 2011 : 58.134 no trânsito
52.198 por homicídio
ESTATÍSTICA - sentido comum98% dos acidentes de trânsito são causados por ERRO ou NEGLIGÊNCIA humana.
Principais causas:
1)Usar o celular ao volante:
ler mensagem de texto a 60 km/h = 76 metros às cegas
2) Dirigir alcoolizado =
21% acidentes, pelo menos um estava alcoolizado
ESTATÍSTICA - sentido comum
3) Dirigir colado na traseira do carro à frente:
12% acidentes nas estradas federais
4) Dirigir acima da velocidade permitida
12% acidentes
5) Deixar de usar cinto de segurança
60 km/h = 1.000 kgs
Revista Veja, edição 2333 nº 32 de 7/08/2013
ESTATÍSTICA
• Vem do latim “status” = Estado
• inicialmente envolvia:– compilações de dados e gráficos representativos
dos vários aspectos de um estado ou país.• taxa de mortalidade, • taxa nascimento,• renda, • taxas de desemprego, etc.
ESTATÍSTICA
• É uma coleção de métodos para:– planejar experimentos,
– obter dados,
– organizar,
– resumir,
– analisar
– concluir sobre as informações coletadas
Estatística
• Ramo da matemática que analisa dados estatísticos– Estatística Descritiva– Inferência Estatística
Aplicação na Administração(DOWNING, DOUGLAS;CLARK JEFFREY – ESTATÍSTICA APLICADA)
• Uma firma que está se preparando para lançar um novo produto precisa conhecer as preferências do consumidor no mercado de interesse.
Deve-se fazer pesquisa de mercado entrevistando um número de residências escolhidas aleatoriamente.
Poderá usar os resultados para estimar as preferências da população.
Aplicação na Administração
• A venda de automóveis é influenciado por:- modelo
- cor - poder aquisitivo,
- concorrência-Através da análise de regressão pode-se determinar quais fatores têm efeitos mais importantes
Aplicação na Administração
• Antes de lançar um novo remédio no mercado, é necessário fazer várias experiências para garantir que o produto é seguro e eficiente.Toma-se dois grupos tão semelhantes quanto possível, e dar o remédio a um grupo, mas não a outro.Verificar se os resultados nos dois grupos são diferentes.Determina-se que eventuais diferenças observadas são causadas pelo remédio ou por outros fatores
Aplicação na Administração
• No recebimento de um grande embarque de mercadorias de um fornecedor, teremos de nos certificar de que o produto realmente satisfaz os requisitos de qualidade acordados.
Inspeciona-se uma amostra de itens escolhidos aleatoriamente inferindo-se sobre a qualidade de todo o lote
Aplicação na Administração
• Auditor: verificar livros de uma firma para certificar que os lançamentos refletem a situação financeira da companhia.
Em vez de examinar todos os documentos originais (notas de venda, ordens de compra, requisições), verifica-se apenas uma amostra de documentos escolhidos aleatoriamente, inferindo o resultado sobre toda a população
Estatística
• tem objeto e métodos próprios• não tem um objetivo em si mesma.• tem como função auxiliar as outras ciências,
sendo portando considerada um método científico de trabalho
• não é uma ciência.
Estatística
• UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos:– Física Química Economia– Biologia Engenharia Medicina– Ciências Sociais– Ciências Administrativas, etc.
Estatística
• Estatística pode ser dividida em duas partes:– .Estatística Descritiva - cuida da:
• Organização
• descrição dos dados experimentais;
– .Estatística Indutiva - cuida da:
• análise
• interpretação dos dados
Estatística
• Conceitos fundamentais:
– POPULAÇÃO
– AMOSTRA
População (Universo Estatístico)
• conjunto de elementos com pelo menos uma característica comum.
• Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem.
• Exemplo: Vamos estudar o desempenho dos estudantes em 2011. – POPULAÇÃO = todos os estudantes de 2011
População - Universo Estatístico
• COMO DEFINIR UMA POPULAÇÃO?• A quem interessa este resultado?• Se o analista dos resultados for o
responsável pelos cursos Administração, será que interessa a ele o desempenho dos alunos de Engenharia?
• Devemos procurar as características que interessam ao analista dos resultados
População - Universo Estatístico
• Os alunos do curso “ X ” em 2013• Os alunos do curso “ X “ em 2013 que
cursam o 4º semestre;• a cada item, estamos especificando cada vez
mais as características das pessoas a serem observadas, restringindo a “população” objeto de nossos estudos.
Levantamento
• definida as características da POPULAÇÃO, o passo seguinte é o levantamento de dados acerca das características objeto de estudo.
• PERGUNTA-SE...• Deve-se pesquisar dados de toda a
população?
Levantamento
• Em grande parte das vezes não é conveniente e em muitas vezes é impossível
• E Por que?
Levantamento
TEMPO: as informações devem ser obtidas com rapidez
PRECISÃO: as informações devem ser corretas
CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível.
Amostra• Outros motivos para se tomar uma amostra
– Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados.
– Testes destrutivos– exame de sangue de um paciente– trabalho extenso: anotações erradas
Amostra• Devemos então delimitar nossas
observações a uma parte da população, isto é, a uma amostra proveniente dessa população.
• AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.
Amostra
• A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.
• A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo.
• Logicamente a indução não traz resultado exato, dando margem a erro.
Amostra
• A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade.
Amostra
• Quanto maior a amostra, mais confiáveis serão as induções ?
• erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem.
POPULAÇÃO E AMOSTRA
POPULAÇÃO: – é uma coleção completa de todos os elementos
a serrem estudados
AMOSTRA:– é um subconjunto da população
CENSO:– é uma coleção da dados relativos a todos os
elementos de uma população:
Variável• Antes de tudo, é necessário que se tenham
bem definidas quais características deverão ser verificadas. Ex.: Alunos de Administração. (Universo Estatístico ou População).
• Dentro da população, é preciso definir quais as características que nos interessa averiguar. Ex. idade, sexo, estado civil, etc.
• A escolha da variável dependerá dos objetivos do estudo estatístico.
Variável• é o conjunto de resultados possíveis de um
fenômeno.• é a característica ou propriedade da
população que está sendo medida. Ex.:– População: moradores de uma cidade– Variável : número de filhos– População: alunos de Administração– Variável : sexo
Variável– População: moradores de um prédio– Variável : peso
• CLASSIFICAÇÃO DA VARIÁVEL• pode ser: • A) QUANTITATIVA A 1 - DISCRETA
A.2 - CONTÍNUA• B) QUALITATIVA B 1 - NOMINAL
B.2 - ORDINAL
A - Variáveis Quantitativas
• quando pode ser expressa em números. Ex:– quantidade de valores de notas de uma moeda– quantidade de sabores de refresco– duração de uma bateria de telefone celular– número de ossos existentes em um animal
A - Variáveis Quantitativas• A.1. - Quantitativas DISCRETAS:
– quando os valores podem assumir apenas determinados valores e resultam de uma contagem.
– O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex:
• valores das cédulas da moeda brasileira• número de filhos dos casais de Lins
A - Variáveis Quantitativas• A.2. - Quantitativas CONTÍNUAS:
– quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor.
– Obtido por medição. Ex;• peso de um paciente• altura • tempo de vôo entre duas cidades
B - Variáveis Qualitativas
• quando a variável é não numérica ou definida através de atributos, categorias. Ex:– sexo– religião– naturalidade– cor dos olhos
B - Variáveis QualitativasB.1. - qualitativas NOMINAIS:
não tem ordenamento nem hierarquia;
Ex: sexo dos pacientes da clínica; tipo de convênio utilizado.
B.2. - qualitativas ORDINAIS: existe uma ordem, uma hierarquia;
Ex: presidente, diretor, gerente, etc...
Classificação: bom, regular, ruim.
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• ESCALA NOMINAL:
– dão nome a uma categoria ou classe.
– Os dados não podem ser dispostos em um esquema ordenado.
Ex: Respostas do tipo “sim”, “não” ou “indeciso”
Procedência de qual cidade (Lins, Promissão, etc.)
– não se faz cálculos (ex: tirar a média)
– algumas vezes são atribuídos números aos dados para serem inseridas no computador: 0 - sim; 1 - não, 2 - indeciso. Neste caso são apenas rótulos e não podem ser efetuados cálculos com estes números.
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• ESCALA ORDINAL:
– dão nome e uma ordem a uma categoria ou classe.
– Diferença entre os valores dos dados não podem ser determinadas ou não fazem sentido.
• Ex: grau de instrução:1= sem instrução; 2 = ensino fundamental; 3 = ensino médio, 4 = superior; 5 = Mestre; 6 = Doutor.
Não mantém a propriedade dos números: embora 3 seja maior do que 2, não significa que 3 + 2 = 5.
– Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3.
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado.
Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º.
Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário.
• ESCALA PROPORCIONAL ou NÍVEL DE RAZÃO: Apresenta um ZERO absoluto. Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs.
Variáveis DEPENDENTES E INDEPENDENTES
Variável Independente:– é a que influencia, determina ou afeta outra variável;
– referida como fator determinante, condição ou causa para ocorrência de determinada resposta.
Variável dependente:– a sua resposta varia em virtude dos diferentes valores
que a variável independente pode assumir;
– modificando-se a variável independente, altera-se o valor da variável dependente.
Variáveis DEPENDENTES E INDEPENDENTES
• Variável Independente (VI): é o antecedente;• Variável dependente(VD): é o conseqüente
Variável Independente Variável Dependente
idade comprimento
sexo Resistência física
Variáveis DEPENDENTES E INDEPENDENTES
• Como detectar se uma variável é dependente ou independente ?
• Critério de sucetibilidade à influência:– Variável dependente é alterada ou influenciada pela
variável independente:
– Ex: dependente: predisposição a problemas cardíacos
independente: sexo
Variáveis DEPENDENTES E INDEPENDENTES
• Critérios para identificar o sentido de influência entre as variáveis dependente e independente ?
• 1) Ordem temporal:– o que ocorre depois não pode influenciar o que
aconteceu antes. Ex:V. independente V. dependente
Aumento do U$ em relação ao R$
Aumento dos preços dos combustíveis
Variáveis DEPENDENTES E INDEPENDENTES
• 2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não são sujeitas a influências. Ex:
– suscetibilidade a certas doenças está associada ao sexo do indivíduo;
– variáveis bioquímicas em animais e no homem são dependentes da idade.
– Peso do recém-nascido está relacionado com a ordem de nascimento.
CO-VARIÁVEIS
• Em todo experimento existe:– variável dependente: a ser analisada;– variável independente:
• que são fatores que influenciam os resultados da variável dependente;
• determinam as condições sob os quais a variável dependente é obtida.
• Podem interferir nos resultados da pesquisa
CO-VARIÁVEIS
é um fator que o pesquisador procura neutralizar intencionalmente em uma
investigação, com a finalidade de impedir que interfira na análise da relação entre as
variáveis independentes e dependentes
Tabela Primitiva • Dado um levantamento de dados estatísticos
de uma variável quantitativa, como por exemplo, a altura dos alunos , que tenha dado os seguintes valores (em cm.):
• 165 167 172 160 158 175 157 168
174 179 154 160 173 181 155 166
185 172 157 164 170 168 174 155
Tabela Primitiva • Notamos que a tabela não está
numericamente organizada. • A esta tabela denominamos TABELA
PRIMITIVA.• com os dados dispostos desta maneira é
difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento.
• Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente.
ROL• 154 155 155 157 157 158 160 160
164 165 166 167 168 168 170 172172 173 174 174 175 179 181 185
• Concluímos que a menor estatura é de 154 e a maior é de 185.
• A amplitude é de 185 - 154 = 31.• A leitura da tabela fica mais clara.• A esta tabela organizada denominamos ROL.
Estatística• Resumindo:
• TABELA PRIMITIVA: é a tabela onde o : é a tabela onde o conjunto de elementos não foram conjunto de elementos não foram numericamente ordenados.numericamente ordenados.
• ROL: a tabela onde os dados foram a tabela onde os dados foram numericamente ordenados de forma numericamente ordenados de forma crescente ou decrescentecrescente ou decrescente.
Distribuição de Freqüência• Para facilitar a análise dos dados:
– vamos ordenar em colunas colocando o número de vezes que aparece repetido.
• TABULAR: é registrar quantas vezes o termo aparece no rol.
• Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados
Distribuição de Freqüência
Altura
• Estaturas dos alunos
freqüência
154 1
155 2
157 2
158 1
160 2
154 1
Altura freqüência
165 1
166
167 1
2
170 1
172 2
168
1
Fonte: Dados fictícios
Distribuição de Freqüência
Altura
• Estaturas dos alunos de um determinado curso
freqüência
173 1
174 2
175 1
179 1
181 1
185 1
total 24
Distribuição de Freqüência• Para facilitar a análise dos dados obtidos,
agrupar os valores em intervalos de classes (principalmente para variáveis contínuas).
• Assim dividimos nossa distribuição em INTERVALOS DE CLASSE
• INTERVALO DE CLASSE: é a forma de agrupar valores.
Distribuição de FreqüênciaALUNOS DE DETERMINADO ANO
Altura freqüência
154 158.......... 5
158 162.......... 3162 166.......... 2
166 170.......... 4
170 174.......... 4
174 178.......... 3
178 182.......... 2
182 186.......... 1
total......... 24
Fonte: Dados fictícios
Distribuição de Freqüência• CLASSES DE FREQÜÊNCIA
• São intervalos de variação da variável As classes são representadas
simbolicamente por “ i ” Assim o intervalo 162 166 define a 3ª
classe i = 3
A distribuição é formada por 8 classes
Distribuição de Freqüência
As classes são:
1ª classe: 154 158
2ª classe 158 162
3ª classe 162 166
4ª classe 166 170
5ª classe 170 174
6ª classe 174 178
7ª classe 178 182
8ª classe 182 186
Distribuição de Freqüência• LIMITES DE CLASSE
• São os extremos de cada classe. Temos• li = limite inferior da classe
• ls = limite superior da classe
• Referente à 3ª classe temos:– 162 166 li = 162 inclui limite inferior
– lS = 166 exclui limite superior
Distribuição de Freqüência• FREQÜÊNCIA
• É o número de ocorrências em que uma única característica é observada.
• FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi)
• São os valores que representam o número de dados de classe
• é resultante da contagem.• Ex: Na 3ª classe a freqüência foi igual a 2, ou
seja duas pessoas têm estatura entre 162 a 166 cm (exclusive).
Distribuição de Freqüência• FREQÜÊNCIA ACUMULADA (Fac ou Fi )
• É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes.
• FREQÜÊNCIA RELATIVA ( Fr )
• É dado pela razão da freqüência simples e a freqüência total.
Fr = freqüência simples (f i)
freqüência total
Distribuição de FreqüênciaFREQÜÊNCIA RELATIVA PERCENTUAL
(Fr %)
Fr % = Fr x 100
PONTO MÉDIO ( PM )• É o ponto que divide o intervalo de classe em
duas partes iguais.
PM = li + ls
2
Distribuição de FreqüênciaAMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT)
• AT=limite superior máximo-limite inferior mínimo
• No nosso exemplo AT = 186 - 154 = 32
AMPLITUDE DE UM INTERVALO DE CLASSE ( h )
h = limite superior da classe - limite inferior da classe
h = ls - li
1) Quantos elementos foram pesquisados?
2) Quantas pessoas têm altura entre 160 (inclusive) e 170 (excluindo)
3) Isto representa quantos porcento do total?
4) Quantos porcento têm altura entre 160 (inclusive ) e 180 (excluindo)?
5) Quantas pessoas têm altura inferior a 170?
6) Quantos porcento têm altura de no mínimo 160?
7) Quantos porcento têm altura abaixo de 180?
8) Qual a classe (faixa de altura) de maior freqûëncia? Quantos porcento esta classe representa do total?
9) Qual a classe de menor freqüência? Quantos alunos representam?
10) Se for sorteado um elemento ao acaso, qual a probabilidade deste elemento ter altura mínima de 170?
11) Escolhido um aluno ao acaso, sabendo-se que ele têm altura abaixo de 170, qual a probabilidade dele ter altura entre 160 (inclusive) e 170?
12) Escolhido um aluno ao acaso, sabendo que ele tem altura maior ou igual a 160, qual a probabilidade dele ter altura acima de 170?
Histograma
Comprimento de peças produzidas
0
2
4
6
8
10
12
158 162 166 170 174 178 182 186
comprimento
Fre
qü
ên
cia
Polígono de Freqüências
0
5
10
15
20
25
30
1 2 3 4 5 6 7
GRÁFICOS
Variáveis qualitativas
Variáveis QualitativasDefeitos em um lote de peças
Defeitos quantidade
Cor 20
Mancha 11
Risco 8
Espessura 6
Textura 5
total 50
Fonte: Dados fictícios
Gráfico de colunasDefeitos em um lote de peças
0
5
10
15
20
25
cor manchas risco espessura textura
Defeitos
Qu
anti
dad
e
Gráfico de barras
Defeitos em um lote de peças
0 5 10 15 20 25
cor
manchas
risco
espessura
textura
De
feit
os
quantidade
Gráfico de setores ou “pizza”
Defeitos em um lote de peças
cor40%
manchas10%
risco16%
espessura22%
textura12%
75
Diagrama de Pareto
MAIORIA DAS PERDAS
POUCOS TIPOS
DEFEITOS
Pequenas quantidades de
causas
Se identificados;
pode-se eliminar a maiorias das perdas concentrando-se nestas causas principais
76
Diagrama de Pareto
• No controle de qualidade– Dr. J.M Juran demonstrou que em muitos
casos:
•a maior parte dos defeitos decorrem de um número relativamente pequeno de causas.
Variáveis QualitativasDefeitos em um lote de peças
Defeitos ( %) ( % )
acumuladaCor 40 % 40 %
Mancha 22 % 62 %
Risco 16 % 78 %
Espessura 12 % 90 %
Textura 10 % 100 %
total 100 %
Fonte: Dados fictícios
Diagrama de Pareto
0%
10%
20%
30%
40%
50%60%
70%
80%
90%
100%
cor manchas risco espessura textura
•MEDIDAS DE TENDÊNCIA CENTRAL
•MEDIDAS DE DISPERSÃO
79
Estatística
• ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO:
Medidas de posição
Medidas de variabilidade ou dispersão
80
Medidas de Tendência Central
• É um valor calculado para um grupo de dados• usado para descrever esses dados. • Tipicamente, desejamos que o valor seja
representativo de todos os valores do grupo• os dados observados tendem, em geral, a se
agrupar em torno dos valores centrais.
81
Medidas de Tendência Central
• São Medidas de Tendência Central:
1. média;
2. mediana;
3. moda
82
1 - MÉDIA ARITMÉTICA
• definida como a soma dos valores dividida pelo número de elementos.
• Sua aplicação é seguramente a mais usada• podem ser:
– Média para dados simples– Média para dados agrupados– Média para dados agrupados em classes.
83
Exemplo: Dado um a idade de 5 crianças
Xi (idade) : 4; 6; 8; 10; 12
média - x = 4 + 6 + 8 + 10 +12
5
X = ∑xi n
sendo “ n “ o número de elementos
Assim: X = 40 = 8 5 Portanto a idade média dessas 5 crianças é 8 anos.
84
1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população:
• Exemplo: Notas de 20 alunos:
Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3
5, 5, 5, 5, 5, 5, 6, 6, 6, 9
X = 1+1+1 + 2+2+2 + 3+3+3+3 + 5+5+5+5+5+5 + 6+6+6 + 9 20
X = 1 . 3 + 2 . 3 + 3 . 4 + 5 . 6 + 6 . 3 + 9 .1 = 3+6+12+30+18+9 3 + 3 + 4 + 6 + 3 + 1 20 85
1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população:
• Quando o conjunto de dados para os quais precisamos calcular a média é mais extenso, temos a necessidade de agrupar os dados. Assim, a média desse grupo é calculado da seguinte forma:
X = (Xi . fi )
fi
86
1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA)
amostra: (X) população:
Xi fi Xi . fi
1 3 3 X = Xi . fi
2 3 6 fi
3 4 12 X = 78 = 3,9
5 6 30 20
6 3 18
9 1 9
- 20 78
Fonte: dados fictícios 87
1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA)
amostra: (X) população:
IDADE DE ALUNOS
Xi PM fi PM.fi
0 2.......... 1 3 1.3 = 3
2 4.......... 3 7 3.7 = 21 4 6.......... 5 6 5.6 = 30
6 8.......... 7 3 7.3 = 21
8 10.......... 9 1 9.1 = 9
total ......... 20 84
Fonte: Dados fictícios
X = (PM. Fi ) X = 84 X = 4,2
fi 20
88
1.3. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM CLASSES
amostra: (X) população:
2 – MEDIANA ( X )
• É o valor que se localiza no centro da distribuição
• é obtida a partir de seus valores centrais• Pode ser:
2.1 MEDIANA PARA DADOS SIMPLES
2.2 MEDIANA PARA DADOS AGRUPADOS
2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES INTERVALARES
89
2.1 MÉDIANA PARA DADOS SIMPLES (X)
Há duas situações:
1) Quando o número de elementos pesquisados é ímpar
Xi (idade) : 4; 6; 8; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª
“ n “ o número de elementos ímparUma posição central - P
P = n +1 P = 5 + 1 = 3ª posição => Xi = 8, portanto X = 8 2 2
~
posição central
Xi
~
90
2.1 MÉDIANA PARA DADOS SIMPLES (X)
2) Quando o número de elementos pesquisados é par
Xi (idade) : 4; 6; 8; 10; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª 6ª
~
X1 X2
~
P1 P2 (2 Posições centrais)
~
“ n = 6 número PAR de elementosDuas posições centrais - P1 e P2
P1 = n P1 = 6 = 3ª posição => X1 = 8, X = X1 + X2 = 8 + 10
2 2 2 2P2 = é a próxima P2 = 4ª posição => X2= 10, X = 9
91
2.2 MEDIANA PARA DADOS AGRUPADOS
1)Quando o nº de elementos é IMPAR Xi fi fac nº de elementos =
1 2 2 fi = 19 (ímpar) 2 3 5 3 4 9 uma posição
central 5 6 15 P = fi +1 =
19+1 6 3 18 2 2 9 1 19 P = 10ª posição - 19
92
2.2 MEDIANA PARA DADOS AGRUPADOS
Xi fi fac 1 2 2 2 3 5
3 4 9 5 6 15 6 3 18
9 1 19 Σ 19
Xi 1 1 2 2 2 3 3
posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª
Xi 3 3 5 5 5 5 5 posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª
Xi 5 6 6 6 9 posição 15ª 16ª 17ª 18ª 19ª
Xi 1 1 2 2 2 3 3
posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª
Xi 3 3 5 5 5 5 5 posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª
Xi 5 6 6 6 9 posição 15ª 16ª 17ª 18ª 19ª
93
2.2. MÉDIANA PARA DADOS AGRUPADOS
~
1) Quando o nº de elementos é IMPAR
Xi fi fac P = 10ª posição 1 2 2 2 3 5 3 4 9
Xi = 5 6 15 6 3 18 X = 5 9 1 19 - 19
94
2.2 MÉDIANA PARA DADOS AGRUPADOS
2)Quando o nº de elementos é PAR
Xi fi fac nº de elementos = fi = 20(par) 1 2 2
2 3 5 3 4 9 duas posição centrais 5 6 15 P1 = fi = 20 = 10ª posição 6 3 18 2 2 9 2 20 P2 = é a próxima= 11ª posição - 20
95
2.2 MÉDIANA PARA DADOS AGRUPADOS
~
2)Quando o nº de elementos é PAR
Xi fi fac P1 = 10ª posição
1 2 2 P2 = 11ª posição
2 3 5
3 4 9
X1= X2= 5 6 15
6 3 18 X = (X1+ X2) = 5 + 5
9 2 20 2 2
- 20 X = 5
96
2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO CENTRAL “P”
P = Fi P = 23 P = 11,5º posição
2 2
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA”
97
2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO CENTRAL “P”
P = Fi P = 23 P = 11,5º posição
2 2
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA”
li
ls
98
2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição central -> P = 11,5º posição
Limite inferior da classe -> li = 2
Limite superior da classe -> ls = 4
Amplitude da classe -> h = ls - li = 4 – 2 = 2
Freqüência da classe -> fi = 10
Freqüência acumulada anterior -> faa = 3
li
ls
P - faa . h fi
+li=X~
11,5 - 3 . 2 10
+=~X 2
99
2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
li
ls
8,5 . 2 10
+2=X~
X = 2 + 0,85 . 2~
X = 2 + 1,70~
X = 3,70~
100
2 – MODA ( X )
• É o ponto de maior concentração de ocorrências de uma variável
• Coincide com o conceito vulgar da palavra, isto é, o que ocorre com maior freqüência
^
101
2.1 – MODA PARA DADOS SIMPLES ( X )
• Exemplo: Notas de 20 alunos:
Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3
5, 5, 5, 5, 5, 5, 6, 6, 6, 9
O valor que apareceu maior número de vezes é o 5
portanto => X = 5
^
^
102
2.2 – MODA PARA DADOS AGRUPADOS ( X )^
^
Maior valor de fiXi =
Xi = 5
Xi fi 1 2 2 3 3 4 5 6 6 3 9 1 - 19
103
2.3. MODA PARA DADOS AGRUPADOS EM CLASSES – MODA DE CZUBER - Xcz
fmax
Xi PM fi
0 2.......... 1 3
2 4.......... 3 10 4 6.......... 5 6
6 8.......... 7 3
8 10.......... 9 1
total ......... 23
1º passo: Achar a classe onde se encontra a maior freqüência - fmax
^
104
2.3. MODA DE Czuber - XCZ
Xi PM fi
0 2.......... 1 3
2 4.......... 3 10 4 6.......... 5 6
6 8.......... 7 3
8 10.......... 9 1
total ......... 23
Limite inferior => li = 2 freqüência máxima => fmax = 10
Limite superior => ls = 4 freqüência anterior => fant = 3
freqüência posterior => fpost = 6
Amplitude da classe=> h = ls – li = 4 – 2 = 2
1 = fmax – fant = 10 – 3 = 7
2 = fmax – fpost = 10 – 6 = 4
li
ls
^
fant
fpos
fmax
105
2.3. MODA DE Czuber - XCZ^
Limite inferior => li = 2 freqüência máxima => fmax = 10
Limite superior => ls = 4 freqüência anterior => fant = 3
freqüência posterior => fpost = 6
Amplitude da classe=> h = ls – li = 4 – 2 = 2
1 = fmax – fant = 10 – 3 = 7
2 = fmax – fpost = 10 – 6 = 4
Cálculo da moda de Czuber
Xcz = li + ___ 1 ___ . h
1 + 2
Xcz = 2 + __7__ . 2 = 2 + _7_ . 2 = 2 + 14 = 2 + 1,3 = 3,3
7 + 4 11 11
^
^
106
2.3. MODA DE KING - Xki
Xi PM fi
0 2.......... 1 3
2 4.......... 3 10 4 6.......... 5 6
6 8.......... 7 3
8 10.......... 9 1
total ......... 23
Limite inferior => li = 2 freqüência máxima => fmax = 10
Limite superior => ls = 4 freqüência anterior => fant = 3
freqüência posterior => fpost = 6
Amplitude da classe=> h = ls – li = 4 – 2 = 2
li
ls
^
fant
fpos
fmax
107
2.3. MODA DE KING - Xki^
^
^
Limite inferior => li = 2 freqüência máxima => fmax = 10
Limite superior => ls = 4 freqüência anterior => fant = 3
freqüência posterior => fpost = 6
Amplitude da classe=> h = ls – li = 4 – 2 = 2
Cálculo da moda de KING
Xki = li + fpost . h
fant + fpost
Xcz = 2 + 6 . 2 = 2 + 6 . 2 = 2 + 12 = 2 + 1,3 = 3,3
3 + 6 9 9
108
2.3. MODA DE Pearson - Xpe^
^
^
Cálculo da moda de PEARSON
Xpe = 3. X - 2. X
Exemplo: Em um levantamento de dados onde a Mediana = X = 4
e a Moda = X = 4,2
A moda de Pearson será:
X = 3.4 - 2 . 4,2 = 12 – 8,4
X = 3,6
~
~
_
^
^
109
Outras separatrizes
• A Mediana divide a distribuição em duas partes.
• É o atributo que está no meio da distribuição:– 50% dos valores acima da mediana– 50% dos valores abaixo da mediana
110
Outras separatrizes
QUARTIS ou QUARTILHOS
• o Quartil divide a distribuição em 4 partes de igual freqüência.
• Seu cálculo é importante para as medidas de dispersão e variabilidade
• São três:
111
Outras separatrizes
Quartil
• São três:
• Q1 = quartil inferior ou primeiro quartil. Tem 25% da distribuição abaixo de si
• Q2 = é a mediana ou quartil mediano
• Q3 = quartil superior ou terceiro quartil. Tem 75% da distribuição abaixo de si
112
Quartil
• 1º quartil - Q1 = assume a posição P1q = Σfi
4• 2º quartil – Q2 = assume a posição P2q = 2. Σfi
4 • 3º quartil - Q3 = assume a posição P3q = 3.Σfi
4
113
1º QUARTIL – Q1
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO DO PRIMEIRO QUARTIL “ P1q ”
P1q = Fi P1q = 23 P 1q = 5,75º posição
4 4
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO QUARTIL – Q1”
114
1º QUARTIL – Q1
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição 1º quartil -> P 1q= 5,75º posição
Limite inferior da classe -> li = 2
Limite superior da classe -> ls = 4
Amplitude da classe -> h = ls - li = 4 – 2 = 2
Freqüência da classe -> fi = 10
Freqüência acumulada anterior -> faa = 3
li
ls
P1q - faa . h fi
+li=Q1
5,75 - 3 . 2 10
+=Q1 2
115
1º QUARTIL – Q1
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
li
ls
2,75 . 2 10
+2=Q1
Q1 = 2 + 0,55
Q1 = 2,55
116
3º QUARTIL – Q3
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO DO TERCEIRO QUARTIL “ P3q ”
P3q = 3. Fi P3q = 3. 23 P 3q = 17,25º posição
4 4
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O TERCEIRO QUARTIL – Q3”
117
3º QUARTIL – Q3
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 faa 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição central -> P 3q= 17,25º posição
Limite inferior da classe -> li = 4
Limite superior da classe -> ls = 6
Amplitude da classe -> h = ls - li = 6 – 4 = 2
Freqüência da classe -> fi = 6
Freqüência acumulada anterior -> faa = 13
li
ls
P3q - faa . h fi
+li=Q3
17,25 - 13 .2 6
+=Q3 4
118
3º QUARTIL – Q3
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
li
ls
4,25 . 2 13
+4=Q3
Q3 = 4 + 0,65
Q3 = 4,65
119
Outras separatrizes
Decil
• Dividem a distribuição em 10 partes de igual freqüência.
• São nove
• o quinto decil é a mediana.
120
Decil
• 1º decil - D1 = assume a posição P1d= Σfi
10• 2º decil – D2 = assume a posição P2d = 2. Σfi
10
• 9º decil - D9 = assume a posição P9d = 9.Σfi
10
121
1º DECIL – D1
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO DO PRIMEIRO DECIL “ P1d ”
P1d = Fi P1d = 23 P 1d = 2,3º posição
10 10
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO DECIL – D1”
122
1º DECIL – D1
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição 1º DECIL -> P 1d= 2,3º posição
Limite inferior da classe -> li = 0
Limite superior da classe -> ls = 2
Amplitude da classe -> h = ls - li = 2 – 0 = 2
Freqüência da classe -> fi = 3
Freqüência acumulada anterior -> faa = 0
li
ls
P1d - faa . h fi
+li=D1
2,3 – 0 . 2 3
+=D1 0
123
1º DECIL – D1
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
2,3 . 2 3
+0=D1
D1 = 1,53
124
9º DECIL – D9
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO DO NONO DECIL “ P9d ”
P9d = 9. Fi P9d = 9. 23 P9d = 20,70º posição
10 10
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O NONO DECIL – D9”
125
9º DECIL – D9
li
ls
P9d - faa . h fi
+li=D9
20,7 - 19 .2 3
+=D9 6
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 faa 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição central -> P 9d= 20,7º posição
Limite inferior da classe -> li = 6
Limite superior da classe -> ls = 8
Amplitude da classe -> h = ls - li = 8 – 6 = 2
Freqüência da classe -> fi = 3
Freqüência acumulada anterior -> faa = 19126
9º DECIL – D9
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19 faa
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1,7 . 2 3
+6=D9
D9 = 6 + 1,13
D9 = 7,13
127
Outras separatrizes
Centil ou Percentil
• Dividem a distribuição em 100 partes de igual freqüência.
• São noventa e nove
• o qüinquagésimo centil é a mediana.
128
Percentil - Ci
• 1º percentil - C1 = assume a posição P1c= Σfi
100• 2º percentil – C2 = assume a posição P2c = 2. Σfi
100
• 99ºpercentil - C99 = assume a posição P99c =99.Σfi
100
129
10º PERCENTIL – C10
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO DO DÉCIMO PERCENTIL “ P10c ”
P10c = 10 . Fi P10c = 10 .23 P 10c = 2,3º posição
100 100
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O Décimo Percentil – C10”
130
10º PERCENTIL – C10
Xi PM fi fac
0 2.......... 1 3 3 faa
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição 10º percentil -> P 10c= 2,3º posição
Limite inferior da classe -> li = 0
Limite superior da classe -> ls = 2
Amplitude da classe -> h = ls - li = 2 – 0 = 2
Freqüência da classe -> fi = 3
Freqüência acumulada anterior -> faa = 0
li
ls
P10c - faa . h fi
+li=C10
2,3 – 0 . 2 3
+=C10 0
131
10º PERCENTIL – C10
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
2,3 . 2 3
+0=C10
C10 = 1,53
132
90º percentil – C90
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1º passo: ACHAR A POSIÇÃO DO NONAGÉSIMO PERCENTIL “ P90c ”
P90c = 90. Fi P90c = 9. 23 P90c = 20,70º posição
100 100
2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O nonagésimo percentil – C90”
133
90º PERCENTIL – C90
li
ls
P90c - faa . h fi
+li=C90
20,7 - 19 .2 3
+=C90 6
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 faa 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
Posição central -> P 90c= 20,7º posição
Limite inferior da classe -> li = 6
Limite superior da classe -> ls = 8
Amplitude da classe -> h = ls - li = 8 – 6 = 2
Freqüência da classe -> fi = 3
Freqüência acumulada anterior -> faa = 19134
90º PERCENTIL – C90
Xi PM fi fac
0 2.......... 1 3 3
2 4.......... 3 10 13 4 6.......... 5 6 19
6 8.......... 7 3 22
8 10.......... 9 1 23
total ......... 23
1,7 . 2 3
+6=C90
C90 = 6 + 1,13
C90 = 7,13
135
Relações
Quartil Decil Percentil Mediana
D1 = C10
Q1 = = C25
Q2 = D5 = C50 = X
Q3 = = C75
D9 = C90
~
136
Outras médiasMÉDIA DE INTERVALOÉ a média entre a menor e a maior observação em um
conjunto de dados.
MÉDIA DAS JUNTAS ou MidhingeÉ a média entre o primeiro e o terceiro quartil.
XXMENOR MENOR + X+ XMAIORMAIOR
22Média de Intevalo =Média de Intevalo =
Outras médiasOutras médias
XXMENOR MENOR + X+ XMAIORMAIOR
22Média de Intevalo =Média de Intevalo =
QQ1 1 + Q+ Q33
22MidhingeMidhinge = =
137
Medidas de Dispersão
• As Medidas de Tendência Central:– representam de certa forma uma determinada
distribuição de dados– só elas não são suficientes para caracterizar a
distribuição.
• Para uma análise estatística mais exata é necessária a verificação da flutuação dos valores em torno de sua média aritmética
138
Medidas de Dispersão
• Suponha as notas de 2 grupos de estudantes, cada qual com 5 alunos.
• GRUPO “A” : 4, 5, 5, 6
• GRUPO “B” : 0, 0, 10, 10
• Média do grupo “A”: 5
• Média do grupo “B”: 5
139
Medidas de Dispersão
• Os dois grupos apresentam a mesma média
• O comportamento dos 2 grupos são bem distintos. GRUPO “A”: valores são mais homogêneos
GRUPO “B”: valores são dispersos em
relação à média
140
Medidas de Dispersão
• Dentre as medidas de dispersão pode-se citar algums delas:– a) Amplitude Total– b) Amplitude Interquartil– c) Desvio Quartílico ou Amplitude Semi-interquartílico– d)Desvio Médio– e) Variância– f) Desvio Padrão
141
a) Amplitude Total - R
– é a diferença entre o maior e o menor valor observados.
R = Limite superior - Limite Inferior
• Exemplo 5: Idade de 20 alunos:
Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9
R = 9 – 1 = 8
142
b) Amplitude Interquartil – AIQou IQR ( InterQuartile Range )
é a diferença entre o terceiro quartil e o primeiro quartil.
AIQ ou IQR = Q3 - Q1
– Supera a dependência dos valores extremos– Abrange 50% dos valores centrais,
eliminando os 25% dos valores mais baixos e os 25% dos valores mais altos
143
c) Desvio Quartílico ouAmplitude Semi-interquartílicoé a diferença entre o terceiro quartil e o
primeiro quartil.
Dq = Q3 - Q1
2
144
d) Desvio Médio - DM
é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra
DM = Σ Xi – X_
n - 1
Sendo: DM = Desvio Médio Xi = vr. variável
n = nº elementos
X = média aritmética
d) Desvio Médio - DM
Para uma população
DM = Σ Xi – _
n Sendo: DM = Desvio Médio Xi = vr. variável
n = nº elementos
= média aritmética
d) Desvio Médio - DM
Exemplo 6: Dado o levantamento:
Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10
a) Calcule a média X = = = 4
b) Montar a tabela a seguir:
ΣΣ Xi Xinn
40401010
d) Desvio Médio - DMXi Xi - x Xi – x 2 2 – 4 = - 2 2 2 2 – 4 = - 2 2 3 3 – 4 = - 1 1 3 3 – 4 = - 1 1 3 3 – 4 = - 1 1 DM = = 4 4 – 4 = 0 0 4 4 – 4 = 0 0 DM = 1,56 4 4 – 4 = 0 0 5 5 – 4 = 1 110 10 – 4 = 6 6
Σ 14
ΣΣ Xi – x_ Xi – x_ n - 1n - 1
1414 99
Considerando uma amostra
e) Variância – população: 2
amostra: s2
– é a média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética
– Revela a dispersão do conjunto que se estuda
é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra
s2 = Σ (Xi – X )2_
n - 1
Sendo: s2= variância amostra Xi = vr. variável
n = nº elementos
X = média aritmética
e) Variância – população: 2
amostra: s2
Para uma população
2 = Σ (Xi – )2_
n Sendo: 2 = variância população Xi = vr. variável
n = nº elementos
= média aritmética
e) Variância – população: 2
amostra: s2
d.1) Variância - 2 – dados simples
Exemplo 7: Dado o levantamento:
Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10
a) Calcule a média X = = = 4
b) Montar a tabela a seguir:
ΣΣ Xi Xinn
40401010
d.1) Variância - s2 – dados simplesXi Xi - x ( Xi – x )2 2 2 – 4 = - 2 22 = 4 2 2 – 4 = - 2 22 = 4 3 3 – 4 = - 1 12 = 1 3 3 – 4 = - 1 12 = 1 3 3 – 4 = - 1 12 = 1 s2 = = 4 4 – 4 = 0 02 = 0 4 4 – 4 = 0 02 = 0 4 4 – 4 = 0 02 = 0 s2 = = 5,33 5 5 – 4 = 1 12 = 110 10 – 4 = 6 62 = 36
Σ 48
ΣΣ ( Xi – x ) ( Xi – x )22
n - 1n - 1
4848 99
d.2) Variância - s2 – dados agrupados
Xi fi Xi . fi Xi - x ( Xi – x )2 ( Xi – x )2 . fi 2 2 2 . 2 = 4 2 – 4 = -2 (-2)2 = 4 4 . 2 = 8 3 3 3 . 3 = 9 3 – 4 = -1 (-1)2 = 1 1 . 3 = 3 4 3 4 . 3 = 12 4 – 4 = 0 02 = 0 0 . 3 = 0 5 1 5 . 1 = 5 5 – 4 = 1 12 = 1 1 . 1 = 110 1 10 . 1 = 10 10 - 4 = 6 62 = 36 36 . 1 = 36
Σ fi = 10 Σ fi = 40 Σ fi = 48
se amostra
s2 =
s2 = = 5,33
ΣΣ ( Xi – x ) ( Xi – x )2 2 . fi. fi ΣΣ fi - 1 fi - 1
4848 99
d.2) Variância - s2 – dados agrupados em classes
Xi PM fi PM.fi PM-x ( PM–x )2 ( PM–x )2.fi
0 2..... 1 2 1.2 = 2 1-5= -4 (-4)2 = 16 16 . 2 = 32
2 4..... 3 4 3.4 = 12 3-5= -2 (-2)2 = 4 4 . 4 = 16
4 6..... 5 8 5.8 = 40 5-5= 0 02 = 0 0 . 8 = 0
6 8..... 7 6 7.6 = 42 7-5= 2 (2)2 = 4 4 . 6 = 24
8 10.... 9 1 9.1 = 9 9-5= 4 (4)2 = 16 16 . 1 = 16
total .... 21 105 88
ΣΣ ( PM – x ) ( PM – x )2 2 . fi. fi ΣΣ fi - 1 fi - 1
ΣΣ ( PM.fi) ( PM.fi) ΣΣ fi fi
X = = 105 105 2121
X = 5
ss22 = = 8888 2020
ss22 =
ss22 = 4,4
d) Desvio Padrão
– Por definição, é a raiz quadrada da média aritmética dos quadrados dos desvios
– É a mais utilizada– Revela a dispersão do conjunto que se estuda
para uma população = 22
para uma amostra ss = ss22
e) Desvio Padrão - “” ou “s”– Se todos os valores forem iguais, o desvio padrão
é nulo.– quanto maior o desvio padrão mais heterogênea é
a distribuição, significa que os valores são mais dispersos em torno da média
– MEDIA ± 1 => 68,26% dos valores– MEDIA ± 2 => 95,44% dos valores– MEDIA ± 3 => 99,74% dos valores
f) Coeficiente de Variação - CV
CV = - desvio padrão
X X - média artitmética
– o CV mede o grau de heterogeneidade da distribuição
– Valor máximo é CV = 1
0 ≤ CV ≤ 1
158
Coeficiente de Variação - CV
– Quanto mais próximo de 1:mais heterogênea é a distribuiçãoOs valores estão mais dispersos
– Quanto mais próximo de 0:mais homogênea é a distribuiçãoOs valores da variável estão mais próximos em torno
da média
159
Coeficiente de Variação - CV
– Ex: Dado 2 estudantes cujas notas bimestrais foram:• “a”: 60; 40; 50; 50• “b”: 70; 70; 30; 30• Qual foi mais regular ?
160
f) Coeficiente de Variação - CV
Na comparação de variabilidade de dois ou mais conjuntos de dados:
1. expressos em diferentes unidades de medida
2. expressos nas mesmas unidades, mas com médias diferentes.
161
f) Coeficiente de Variação - CV
Comparação de valores expressos em diferentes unidades de medida
Exemplo 8: Deseja-se comparar qual grandeza varia mais: PESO ou COMPRIMENTO
XPESO = 20 kg XCOMPRIMENTO = 50 metros
PESO = 2 kg COMPRIMENTO = 4 metros
162
f) Coeficiente de Variação - CV
XXPESOPESO
PESOPESOCVCVPP =
COMPRIMENTOCOMPRIMENTO
XXCOMPRIMENTOCOMPRIMENTO
CVCVCC =
22 2020CVCVPP =
44 5050CVCVCC =
CVCVPP = 0,10
CVCVCC = 0,08
CVCVPESOPESO = 0,10 ≥ CVCVCOMPRIMENTOCOMPRIMENTO = 0,08
PESO varia mais que o comprimentoPESO varia mais que o comprimento
163
f) Coeficiente de Variação - CV
expressos nas mesmas unidades, mas com médias diferentes
Exemplo 9: Deseja-se comparar qual grupo “ A ”
ou “ B “ tem mais variação de rendimento em um processo:
XA = 80 % XB = 50 %
A = 2 % B = 1 %
164
f) Coeficiente de Variação - CV AA
CVCVAA =XXAA
BBCVCVBB =
XXBB
22 8080CVCVPP =
11 5050CVCVBB =
CVCVAA = 0,025
CVCVBB = 0,020
CVCVAA = 0,025 ≥ CVCVBB = 0,020
O rendimento do Produto A varia mais que o O rendimento do Produto A varia mais que o rendimento do produto B no decorrer do processorendimento do produto B no decorrer do processo
165
Esquema dos 5 NúmerosBox – Plot ou
Gráfico Box-and-Whisker
Q3
3º Quartil
Q1
1º Quartil
X
Mediana
~
XMENOR XMAIOR
25% dos dados 25% dos dados25% 25%
166
Dados suspeitos ou Outliers
Q1 – 1,5. IQR Q3 + 1,5. IQR
Possível suspeito
Q3 + 3 . IQR
Suspeito
Q1 - 3 . IQR
IQR = Q3 - Q1
167