SumárioEstatística e ProbabilidadeUnidade I
1 CONCEITOS BÁSICOS .......................................................................................................................................11.1 Conceitos fundamentais ......................................................................................................................21.2 Processos estatísticos de abordagem ..............................................................................................21.3 Dados estatísticos ...................................................................................................................................31.4 Dados brutos .............................................................................................................................................4
1.4.1 Rol ....................................................................................................................................................................4
2 ORGANIZAÇÃO DE DADOS – SÉRIES ESTATÍSTICAS .............................................................................52.1 Apresentação dos dados estatísticos ..............................................................................................52.2 Variável discreta .......................................................................................................................................5
2.2.1 Construção de uma variável discreta ................................................................................................62.3 Variável contínua ....................................................................................................................................7
2.3.1 Construção de uma variável contínua ..............................................................................................7
3 REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS .................................................................... 144 MEDIDAS CENTRAIS ....................................................................................................................................... 17
4.1 Somatório ................................................................................................................................................ 174.2 Médias ....................................................................................................................................................... 184.3 Mediana (md) .......................................................................................................................................... 234.4 Moda ......................................................................................................................................................... 25
5 MEDIDAS E DISPERSÃO ................................................................................................................................ 255.1 Amplitude total ..................................................................................................................................... 255.2 Desvio médio simples ......................................................................................................................... 275.3 Variância e Desvio Padrão ................................................................................................................. 31
Unidade II
6 INTRODUÇÃO À PROBABILIDADE ............................................................................................................. 396.1 Teoria dos conjuntos, espaço amostral e eventos ................................................................... 406.2 Conceito de Probabilidade em espaços amostrais equiprováveis .................................... 536.3 Propriedades da Probabilidade ....................................................................................................... 536.4 Probabilidade Condicionada ............................................................................................................ 546.5 Eventos Independentes ...................................................................................................................... 55
7 DISTRIBUIÇÃO BINOMIAL ............................................................................................................................ 568 DISTRIBUIÇÃO DE POISSON ........................................................................................................................ 589 CORRELAÇÃO LINEAR E REGRESSÃO LINEAR ...................................................................................... 59
9.1 Correlação Linear .................................................................................................................................. 599.2 Regressão Linear ................................................................................................................................... 61
10 ESTIMATIVA DE PARÂMETROS ................................................................................................................. 6310.1 Definições .............................................................................................................................................. 6310.2 Teorema do Limite Central ............................................................................................................. 6310.3 Estimação Pontual ............................................................................................................................. 6410.4 Estimativa por Intervalos ................................................................................................................ 6410.5 Intervalo de Confiança para Médias (amostras grandes, n>30) ..................................... 6410.6 Tabela Normal ..................................................................................................................................... 6410.7 Intervalos de Confiança para Médias (amostras pequenas, n<30) ............................... 6610.8 Tabela t-Student ................................................................................................................................ 6810.9 Intervalo de Confiança para Variância e Desvio Padrão .................................................... 6910.10 Tabela da distribuição qui-quadrado .......................................................................................71
11 TESTE DE HIPÓTESE ....................................................................................................................................... 7311.1 Conceitos ............................................................................................................................................... 7311.2 Definições .............................................................................................................................................. 7411.3 Nível de Significância ....................................................................................................................... 7511.4 Teste de Hipótese para Média de População .......................................................................... 75
11.4.1 Grandes Amostras (n>30) ................................................................................................................. 75
1
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Unidade I5
10
15
20
25
30
35
1 CONCEITOS BÁSICOS
O termo “estatística” é oriundo da palavra “Estado”, pois era usado na determinação dos dados colhidos com a finalidade de orientar as decisões quanto ao recolhimento de impostos cobrados dos cidadãos, bem como uma nova estratégia em caso de guerra. Era preciso saber o contingente disponível, a quantidade de alimentos para os soldados, assim como a de armas, ou seja, tudo o que necessário para o empreendimento.
Era registrado também o número de habitantes a partir de anotações dos nascimentos, óbitos, casamentos etc., de modo que surgiram as primeiras análises sistemáticas e as primeiras tabelas e os números relativos.
O conceito de estatística teve um desenvolvimento acelerado a partir do século XVII com os estudos de Bernoulli, Fermat, Pascal, Laplace, Gauss e outros. A forma científica se formou com Achenwall, quando surgiram tabelas mais complexas, as primeiras representações gráficas e o cálculo de probabilidades, de forma que deixou de ser uma simples tabulação de dados numéricos para se tornar um estudo direcionado a conclusões sobre um “todo” partindo da observação de apenas uma parte desse “todo”, isto é, uma “amostra”.
A estatística é, portanto, uma parte aplicada da matemática que tem como objetivo o estudo de fenômenos coletivos, a qual fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados de forma a utilizá-los para a tomada de decisões.
2
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Faz parte da Estatística Descritiva a coleta, a organização e a descrição dos dados, enquanto que a análise, a interpretação dos dados, associada a uma margem de incerteza, compõem a Estatística Indutiva, a qual fundamenta a Teoria da Probabilidade.
1.1 Conceitos fundamentais
• População: conjunto de todos os itens (pessoas ou coisas) que possuem características a serem observadas que sejam de interesse ao estudo de um fenômeno coletivo;
• Amostra: qualquer subconjunto não vazio de uma população;
• Parâmetro: característica numérica adotada para toda a população. Exemplo: verificar a estatura média dos alunos do segundo grau de uma cidade (população) considerando-se duas escolas (amostra) de forma que se considere a predominação da estatura de 1,70 m (parâmetro).
1.2 Processos estatísticos de abordagem
Quando é solicitado o estudo de um fenômeno coletivo podemos optar entre dois processos estatísticos:
1. Censo: avaliação direta de um parâmetro utilizando a coleta de dados de toda a população;
Propriedades:
• Erro processual zero e 100% de confiabilidade;
• Dispendioso;
• Lento;
• Com a demora no processo, ao terminar se torna desatualizado;
• Em cada caso é necessário avaliar sua viabilidade.
3
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
2. Estimação: avaliação indireta de um parâmetro com base em um estimador deduzido por meio do cálculo de probabilidades.
Propriedades:
• Erro processual positivo e confiabilidade inferior a 100%;
• Baixo custo;
• Rápida;
• Dados atualizados ao término do processo em razão de sua rapidez;
• É sempre viável.
1.3 Dados estatísticos
A Estatística descritiva na função da descrição dos dados tem as seguintes atribuições:
• Obtenção ou coleta de dados: realizada em uma fase operacional a partir de questionários, observação direta ou de amostra com um objetivo determinado;
• Organização dos dados obtidos: consiste na ordenação dos valores observados e sua crítica quanto à correção dos valores, das falhas humanas, de omissões e dados duvidosos;
• Redução dos dados: necessária para a compreensão de grande quantidade de dados por meio de simples leitura de valores individuais. A Estatística Descritiva apresenta duas formas básicas de redução do volume de dados: variável discreta e variável contínua.
• Representação dos dados: os dados estatísticos podem ser facilmente compreendidos quando apresentados por meio de gráficos que permitem a
4
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
visualização instantânea e que se tornam importantes ferramentas de trabalho.
1.4 Dados brutos
Quando fazemos observações diretas de um fenômeno coletivo ou coletamos as respostas de um questionário, obtemos uma sequência de valores numéricos. No primeiro momento em que são coletados, estes dados estão completamente desordenados de forma que podemos definir os dados brutos como uma sequência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo.
1.4.1 Rol
Depois de coletar os dados que estão totalmente desordenados e ao ordená-los na forma crescente ou decrescente, esses dados passam a se chamar Rol. Portanto podemos definir o Rol como uma sequência ordenada dos dados brutos.
Observação: após os dados brutos serem organizados em um Rol é que serão tabelados na forma de variável discreta ou contínua.
Exemplo:
Foram medidos vários troncos de árvores em um parque e obtidos os seguintes valores em metros:
X: 4,3; 3,8; 3,2; 3,9; 4,5; 5,4 (dados brutos)
ou
X: 3,2; 3,8; 3,9; 4,3; 4,5; 5,4 (Rol)
5
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
2 ORGANIZAÇÃO DE DADOS – SÉRIES ESTATÍSTICAS
2.1 Apresentação dos dados estatísticos
Quando trabalhamos com dados estatísticos, lidamos com uma grande quantidade de dados. Embora um dos objetivos da estatística descritiva seja reduzir significativamente a quantidade dos dados coletados, para fins didáticos trabalharemos com quantidades reduzidas para facilitar o entendimento.
Tomemos como exemplo as notas de uma avaliação em um grupo de 20 alunos.
Os dados brutos são:
X: 3,5; 4,0; 4,5; 5,0; 7,0; 6,5; 8,0; 3,5; 6,5; 8,0 9,0; 4,5; 5,5; 6,5; 7,0; 8,0; 8,0; 4,5; 6,5; 5,0 (dados brutos)
ou
X: 3,5; 3,5; 4,0; 4,5; 4,5; 4,5; 5,0; 5,0; 5,5; 6,5; 6,5; 6,5; 6,5; 7,0; 7,0; 8,0; 8,0; 8,0; 8,0; 9,0 (Rol)
Observe que há poucos valores diferentes apresentados na lista. Desta forma poderemos contar o número de vezes que os números se repetem na lista, fenômeno este chamado frequência simples.
Quando há poucos valores diferentes na lista podemos agrupá-los no que chamamos de variável discreta.
2.2 Variável discreta
É uma representação tabular de um conjunto de valores dos quais são poucos os valores distintos, isto é, são poucos a representar.
6
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Monta-se uma tabela em que se aponta cada um dos diferentes valores e associado a ele a quantidade de vezes que se repete.
Tomando como exemplo esta distribuição, teremos:
xi 3,5 4,0 4,5 5,0 5,5 6,5 7,0 8,0 9,0
fi 2 1 2 2 1 4 2 3 1
Neste caso, xi é o valor obtido e fi é a quantidade de vezes em que ele aparece.
Importante
Devemos optar por uma distribuição na forma de variável discreta quando o número de elementos distintos da série for pequeno.
2.2.1 Construção de uma variável discreta
É bastante simples. Após construir o Rol da distribuição, coloque em uma coluna os elementos distintos – que denominamos xi – e, em outra coluna, associado ao valor, a quantidade de vezes que esses valores aparecem na sequência – o que denominamos fi.
Exemplo:
Considere o número de peças defeituosas produzidas na linha de montagem de uma indústria metalúrgica durante 20 dias de trabalho, representadas na série a seguir.
X: 0,2,0,1,1,3,0,0,0,0,1,0,1,2,0,3,2,1,2,0
ou
X: 0,0,0,0,0,0,0,0,0,1,1,1,1,1,2,2,2,2,3,3
7
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Temos nove vezes o valor “0”, cinco vezes o valor “1”, quatro vezes o valor “2” e duas vezes o valor “3”.
xi 0 1 2 3
fi 9 5 4 2
Observação: verifique que diminuímos a quantidade de valores com que trabalharemos, de 20 para 8.
2.3 Variável contínua
É uma representação tabular de um conjunto de valores dentre os quais há muitos valores distintos, de modo que ficará difícil a redução dos valores a representar.
Assim, monta-se uma tabela em que são apontados cada um dos diferentes valores dentro de uma faixa considerada, associando-se a quantidade compreendida nessa faixa.
Exemplo:
Classe Intervalo de classe fi
1 41 |------ 45 5
2 45 |------ 49 1
3 49 |------ 53 6
4 53 |------ 57 19
5 57 |------ 61 12
6 61 |------ 64 10
7 64 |------ 69 3
8 69 |------ 73 4
Σ = 60
2.3.1 Construção de uma variável contínua
Realizar a construção da variável contínua requer o conhecimento de alguns conceitos. Vejamos:
8
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
• Classe: são os intervalos de variação da variável. São numeradas seqüencialmente por números inteiros;
• Limites da classe: são os extremos de classe. O menor número é o limite inferior e o maior é o limite superior. O símbolo “|----“ representa um intervalo fechado à esquerda e um aberto à direita.
• Amplitude: é a amplitude do intervalo da classe. É obtida subtraindo-se o limite superior do limite inferior. Importante saber que na distribuição da frequência a amplitude é igual para todas as classes.
• Temos que considerar também a amplitude total da distribuição, que é a diferença entre o limite superior da última classe e o limite inferior da primeira. A amplitude total da amostra (Rol) é a diferença entre o valor máximo e o mínimo da amostra.
• Ponto médio da classe: é o valor que divide a classe em duas partes iguais. Obtém-se calculando a média aritmética entre os extremos de cada classe.
Importante
Devemos optar por uma distribuição na forma de variável contínua quando for grande o número de elementos distintos da série.
Para montar uma tabela de uma distribuição com variável contínua devemos seguir alguns passos ou critérios.
1. Determinar o número de classes
O número de classes a ser utilizado depende muito do pesquisador e também das questões que pretende responder.
9
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Para responder essa questão em nossos exemplos utilizaremos o método da raiz. Sendo “n” o número de elementos e “k” o número de classes que será utilizado, o critério da raiz temos:
k n=
Entretanto, o valor obtido para “k” não será necessariamente um número inteiro. Por isso devemos tomar o valor inteiro obtido e também o seu antecessor e sucessor.
Exemplo:
Se tivermos n=30, teremos k = =30 5 477, .
Consideraremos para k os valores 4, 5 e 6. O valor escolhido dependerá de outra análise quando, para isso, considerarmos o intervalo para a amplitude total da distribuição.
2. Determinar a amplitude da classe
Depois de determinarmos “k”, que é a quantidade de classes, devemos determinar “h”, que é a amplitude da classe a qual será definida por
hAk
t=
em que At é a amplitude total da distribuição, valor que é diferente da amplitude total da amostra.
Exemplo: se tivermos uma distribuição cuja At = 8,
para k = 4, h = =84
2
para k = 5, h = =85
16,
para k = 6, h = =86
1333, ...
10
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Portanto, o valor mais indicado para “k” é o valor “4”, que determinará a amplitude da classe “h” igual a “2”.
Exemplo:
Consideraremos uma distribuição em que são tomadas as medidas, em centímetros, da altura de 28 alunos de uma escola.
Os valores obtidos são:
78 76 84 63 86 81 97
71 73 101 91 88 76 100
78 80 65 78 69 80 102
74 88 90 71 95 81 98
(dados brutos)
ou
63 65 69 71 71 73 74
76 76 78 78 78 80 80
81 81 84 86 88 88 90
91 95 97 98 100 101 102
(Rol)
No primeiro passo fizemos a ordenação dos dados obtidos criando o Rol dos valores. Entretanto isto não é necessário no primeiro momento. Basta localizar o menor e o maior valor da série para determinarmos a amplitude da amostra.
11
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Sendo n = 28, pois temos setenta medidas, o passo seguinte é determinar a amplitude de cada classe.
Primeiramente necessitamos determinar a quantidade “k” de classes.
n k= → =28 28 5 29,
Isso nos leva às seguintes possibilidades:
k
k
k
===
4
5
6
Isto é, podemos ter 4, 5 ou 6 classes. Precisamos determinar a melhor opção.
A amplitude da amostra é:
Menor valor → x1=63
Maior valor → x28=102
A=x28–x1=102–63=39
A amplitude da classe fica:
hAk
=
Portanto, poderemos ter:
h = =394
9 75,
h = =395
7 8,
h = =396
6 5,
12
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Como nenhum dos valores apresenta como quociente um valor inteiro, são necessários alguns acertos.
Importante
Podemos acertar a amplitude total da distribuição para um intervalo, sempre maior que a amplitude da amostra, e nunca menor.
A leitura dos valores tem como valor menor “63” e o maior “102”. A diferença entre eles é de “102–63=39”, que não propicia um resultado exato quando dividido pelas três possibilidades do valor adotado para “k”.
Neste momento temos que acertar o limite do intervalo da distribuição atribuindo novos valores para os extremos e respeitando os valores obtidos.
Em suma, devemos considerar para a amplitude da distribuição um valor inferior a “61” e superior a “103”, de modo que nenhum dos valores medidos em campo fique fora dos cálculos posteriores.
Fazendo uma análise aritmética verificamos que, ao adotarmos o valor inferior da distribuição para x1=61 e superior para x28=103, teremos:
At=103–61=42
e as possibilidades para a amplitude da classe:
h = =424
10 5,
h = =425
8 4,
h = =426
7
13
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Como a classe deve ser um número inteiro, a melhor possibilidade é que tenhamos “h =7”, porque teremos “6” classes distintas no intervalo.
É importante rever os valores obtidos e considerados.
Na apresentação dos valores temos que o menor é “63” e o maior, “102”, com “28” leituras. Isto nos leva à amplitude da amostra A=103–61=42, que não propiciará uma divisão exata quando dividida pelas possibilidades da quantidade de classes, que são “4, 5 e 6”.
Para “acertarmos os intervalos” provocamos uma alteração na amplitude total da amostra (Rol), no intuito de obtermos valores inteiros.
Colocando o valor menor da distribuição em x1=61 e x28=103, a amplitude total será:
At=x28–x1=103–61=42
para n=6 teremos:
h = =426
7
Assim, teremos “6” classes com intervalo “h =7”.
É importante ressaltar que o símbolo “|------“ indica que temos um intervalo fechado à esquerda e aberto à direita. Trocando em miúdos, na segunda classe incluímos o valor “68” e não o “75” que pertence à classe seguinte.
Então, organizando o Rol com os valores desses intervalos, temos:
14
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Classes
1ª → 63 652ª → 69 71 71 73 743ª → 76 76 78 78 78 80 80 81 814ª → 84 86 88 885ª → 90 91 956ª → 97 98 100 101 102
Temos, então, 2 elementos na primeira classe, 4 na segunda, 9 na terceira e, seguindo assim, teremos 3 na oitava.
Colocando em uma tabela, teremos:
classe Intervalo de classe fi
1 661 |------ 668 2
2 668 |------ 175 5
3 775 |------ 882 9
4 882 |------ 889 4
5 889 |------ 996 3
6 996 |------ 1103 5
Resumindo: com a análise desta tabela, notamos que na primeira classe, onde o intervalo é entre 61 e 68, temos apenas dois elementos. Na segunda classe, onde o intervalo é entre 68 e 75, temos 5 elementos. Na sexta classe, onde há o intervalo de 93 a 103, temos 5 elementos. A quantidade de elemento por classe é a frequência absoluta.
3 REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS
Graficamente podemos representar uma série estatística de varias maneiras. Dentre elas podemos citar o gráfico de linhas, de colunas, de setores etc.
15
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
xi fi
0 4
3 2
4 3
6 8
7 4
8 1
9 2
A partir de uma distribuição como esta, podemos gerar:
• um gráfico de colunas;
109876543210
1 2 3 4 5 6 7 8
xi
fi
• um gráfico de barras;
1
xi
fi
2
3
4
5
6
7
8
0 2 4 6 8 10
16
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
• um gráfico de setores;
1
234
56
xi
No gráfico de setores podemos também indicar o percentual da frequência de cada valor obtido em relação a toda a amostragem.
6
54
3
21
xi
Além desses gráficos, que são os mais comuns, também podemos utilizar várias outras maneiras diferentes de representar séries estatísticas. como gráficos de linhas, bolhas e vários outros, cada um adequado para cada questão.
17
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
4 MEDIDAS CENTRAIS
Quando um conjunto de dados é agrupado definem-se medidas que, através de um só número, apresentam suas características. Algumas descrevem a tendência central, isto é, a tendência que esses dados têm de se agrupar em torno de certos valores. É uma medida que estabelece um número ou valor em torno do qual a série se concentra. Divide a série em duas partes iguais.
4.1 Somatório
Quando somamos varias parcelas que têm a mesma característica, representa-se esta soma de “n” valores de uma série, codificando-as conforme a expressão:
x x x x xn ii
n
1 2 31
+ + + + ==∑...
Nesta expressão, “xi” representa uma parcela genérica (termo que consta de todas as parcelas) e “i” é o índice.
Lê-se: somatório dos valores de “xi”, para “i” variando de “1” até “n”.
Exemplo:
x x x x x xii
1 2 3 4 51
5
+ + + + ==∑
x x x x xii
1 2 3 4
1
4
+ + + ==∑
( ) ( ) ( ) ( )x x x xii
i1
12
23
3
1
3
4 4 4 4− + − + − = −=∑
18
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Propriedades:
1. ( )x y x yi ii
n
i ii
n
i
n
± = ±= ==∑ ∑∑
1 11
2. k x k xi ii
n
i
n
. .===∑∑
11
3.xk k
x
x
ki
i
ii
n
i
n
i
n
= = =
==
∑∑∑ 1 1
11
Obs.: podemos também encontrar a notação: x xi ii
n
= ∑∑=1
4.2 Médias
É a medida ou valor que se obtém segundo uma regra estabelecida e é equidistante dos valores extremos de uma série estatística. Temos também as médias proporcional e quadrática, mas veremos apenas as que estão a seguir.
Média aritmética simples
É dada pelo quociente entre a soma dos elementos da série pela quantidade de elementos que compõem esta série.
É dada pela fórmula:
x
x
n
ii
n
= =∑
1
para dados brutos ou rol.
19
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Exemplo:
Dados os valores 3, 0, 4, 6, 8, 9,12, 7:
x
xii= = + + + + + + + = ==∑
1
8
80 3 4 6 7 8 9 12
8498
6 13,
Média aritmética ponderada
É uma média em que a sequência numérica depende dos “pesos” ou da frequência de cada valor na série.
É dada pela fórmula:
x
x f
f
i ii
n
ii
n= =
=
∑
∑
.1
1
Observe que a fórmula é a mesma já vista. Ocorre que, quando termos vários valores que se repetem, a frequência corresponde ao número de vezes que esta repete. Assim, ao multiplicarmos um valor pela sua frequência, estamos fazendo nada mais do que somá-lo pelo número de vezes que se repete. Também o somatório das frequências nada mais é do que a quantidade de elementos da série.
Usa-se tanto para distribuições na forma de variável discreta quanto contínua.
20
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Exemplo: (variável discreta)
Dada a distribuição:
I xi fi xi.fi
1 0 4 0
2 3 2 6
3 4 3 12
4 6 8 48
5 7 4 28
6 8 1 8
7 9 3 27
8 12 6 72
Σ = 31 Σ = 201
x
x f
f
i ii
ii
= = + + + + + + ++ + +
=
=
∑
∑
.. . . . . . . .1
8
1
80 4 3 2 4 3 6 8 7 4 8 1 9 3 12 6
2 4 3 88 1 3 6 420131
6 48+ + + +
= = ,
Exemplo: (variável contínua)
Quando os dados são apresentados na forma de uma variável contínua, utilizamos a fórmula da média aritmética ponderada considerando as frequências simples das classes. Entretanto, como temos uma faixa de valores, o valor de xi é o ponto médio da classe e determinado pela média aritmética dos extremos de cada classe.
xL L
i =+sup inf
2
21
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Exemplo:
Considerando a distribuição:
Classe intervalo de classe fi xi xi.fi
1 60 |------ 70 1 65 65
2 70 |------ 80 5 75 375
3 80 |------ 90 6 85 510
4 90 |------ 100 10 95 950
5 100 |------ 110 12 105 1260
6 110 |------ 120 19 115 2185
7 120 |------ 130 14 125 1750
8 130 |------ 140 3 135 405
Σ = 70 Σ = 7500
Temos
x
x f
f
i ii
n
ii
n= =
=
∑
∑
.1
1
Então
x = =750070
107 14,
Importante
Sempre que tivermos uma tabela na forma de variável contínua, o valor de xi deverá ser considerado como o ponto médio do intervalo da classe.
22
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Média geométrica simples
Em uma sequência numérica simples, a média geométrica simples é definida pela fórmula:
x x x x xg nn= 1 2 3. . ...
Exemplo:
Dados os valores 3, 1, 4, 6, 8, 9,12, 7:
i 1 2 3 4 5 6 7 8
xi 1 3 4 6 8 7 9 12
xg = = =1 3 4 6 7 8 9 12 435456 5 0688 8. . . . . . . ,
Média geométrica ponderada
Em uma sequência numérica na qual há “pesos”, considera-se a frequência com que ocorrem os valores. A média geométrica ponderada é dada por:
x x x xgf f
nfnfi= ∑
11
22. ...
De forma análoga, quando um valor se repete, o produto dele por ele mesmo na frequência que se repete é igual à potência desse valor elevado à sua frequência.
Exemplo: (variável discreta)
Dada a distribuição:
i xi fi
1 1 4
2 3 2
3 4 3
4 6 8
5 8 1
Σfi= 18
23
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Temos:
xg = =1 3 4 6 8 3 544 2 3 8 118 . . . . ,
Exemplo: (variável contínua)
Dada a distribuição:
classe intervalo de classe fi xi
1 2 |------ 4 1 3
2 4 |------ 6 5 5
3 6 |------ 8 6 7
4 8 |------ 10 4 9
5 10 |------ 12 5 11
6 12 |------ 14 4 13
7 14 |------ 16 3 15
8 16 |------ 18 3 17
Σ fi= 31
xg = =3 5 7 9 11 13 15 17 9 101 5 6 4 5 4 3 331 . . . . . . . ,
4.3 Mediana (md)
A mediana é um elemento da série que a divide em duas partes com a mesma quantidade de elementos.
Cálculo da Mediana
Primeiramente devemos ordenar os elementos da série e obter o Rol. Em seguida, determinar “n”, ou seja, o número de elementos da série.
Se “n” for ímpar, o Rol admite apenas um termo central que ocupa a posição ( )”
n +12
. O valor do elemento que ocupa essa posição é a mediana.
24
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Exemplo:
X: 3,4,6,7,9,10,12
A série tem 7 elementos. Portanto o termo que ocupa a posição ( )”
7 12+ , isto é, o 4º elemento, é a mediana.
posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª
valor 3 4 6 7 9 10 12
Assim, md = 7
Se “n” for par, o Rol admite dois termos na posição central. Serão os valores que ocuparem as posições ( )“
n2
e ( )“n2
1+ . A mediana é, então, por convenção, a média aritmética (ou o ponto médio) dos valores que ocupam a posição central.
Exemplo:
Dada a distribuição:
X: 6,13,15,18,22,25
Como temos “n = 6” elementos, as posições centrais são:
n2
62
3= = ª e n2
162
1 4+ = + = ª
a3 = 15 e a4 = 18
Portanto,
md = + =15 182
16 5,
25
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
4.4 Moda
A Moda é o valor que aparece com maior frequência no conjunto de dados. Basta identificar o elemento que aparece com maior frequência.
Exemplo:
X: 3, 4, 3, 3, 4, 5, 6, 8
Nesta distribuição, o elemento que aparece o maior número de vezes é o “3”.
Portanto, mo = 3
5 MEDIDAS E DISPERSÃO
São medidas que avaliam a representatividade da média.
As medidas de dispersão absoluta são: amplitude total, desvio médio simples, variância e desvio padrão.
5.1 Amplitude total
É a única medida de dispersão que não tem na média o seu valor de referência. É obtida pela diferença entre o maior e menor valor da sequência.
Dados brutos ou Rol
Basta identificar o maior e o menor valor da série e calcular a diferença.
Exemplo:
X: 7, 8, 10, 12, 15 At = 15 – 7 = 8
26
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Variável discreta
Como os valores já se apresentam de forma ordenada também basta identificar o primeiro e o último valor da série.
Exemplo:
Dada a distribuição:
i xi fi
1 0 4
2 3 2
3 4 3
4 6 8
5 7 4
6 8 1
7 9 2
Σ= 24
A amplitude total é:
At = x7 – x1 = 9 – 0 = 9
Variável contínua
Nesta situação, embora os elementos já se apresentem em forma ordenada, desconhecemos o menor e maior valores porque estão compreendidos entre o intervalo de cada classe.
Consideramos então os pontos médios dos intervalos de cada classe.
27
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Exemplo:
Dada a distribuição
classe intervalo de classe fi
1 60 |------ 70 1
2 70 |------ 80 5
3 80 |------ 90 6
4 90 |------ 100 10
5 100 |------ 110 12
6 110 |------ 120 19
7 120 |------ 130 14
8 130 |------ 140 3
Σ = 70
Os pontos médios da primeira e oitava classe são:
Inferior = + =60 702
65 Superior = + =130 1402
135
Portanto, a amplitude total é At=135+65=70
5.2 Desvio médio simples
Está baseado no conceito matemático ligado à distância, isto é, à dispersão dos dados em relação à média de uma sequência. Esta é avaliada por meio dos desvios de cada elemento da sequência, em valor absoluto, em relação ao valor médio da sequência.
O desvio médio simples é definido como a média aritmética entre os desvios de cada elemento em relação à média da série.
DMSx x
ni=−∑
28
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Dados brutos ou Rol
Calcula-se a média aritmética entre os valores da sequência e em seguida o desvio, em valor absoluto, de cada valor da sequência em relação ao valor obtido.
O passo seguinte é calcular a média aritmética desses valores.
Exemplo:
Dada a sequência
X: 2, 8, 3, 6 ou X: 2, 3, 6, 8 x = + + + = =2 8 3 64
194
4 75,
d1 2 4 75 2 75= − =, ,
d2 3 4 75 175= − =, ,
d3 6 4 75 175= − =, ,
d4 8 4 75 3 25= − =, ,
DMS = + + + = =2 75 175 175 3 254
94
2 25, , , ,
,
Variável discreta
Quando temos uma sequência apresentada na forma de variável discreta, os dados já vêm ordenados e a frequência representa o número de vezes que o elemento figura na série. Portanto temos valores de desvios que se repetem o que nos levará ao cálculo de uma média aritmética ponderada.
29
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Portanto, calculamos:
DMSx x f
fi i
i=
−∑∑
.
Exemplo:
Dada a distribuição
i xi fi xi.fi
1 0 4 0
2 3 2 6
3 4 3 12
4 6 8 48
5 7 4 28
6 8 1 8
7 9 2 18
Σ = 24 Σ = 120
xx f
fi i
i= = =∑
∑. 120
245
Obs.: x =xm
I xi fi xi.fi |xi – xm| |xi- xm|.fi
1 0 4 0 5 20
2 3 2 6 2 4
3 4 3 12 1 3
4 6 8 48 1 8
5 7 4 28 2 8
6 8 1 8 3 3
7 9 2 18 4 8
Σ = 24 Σ = 120 Σ = 54
30
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
O Desvio médio simples é calculado por:
DMSx x f
fi i
i=
−= =∑
∑.
,5424
2 25
Variável contínua
Do mesmo modo que a variável discreta, os dados já vêm ordenados e a forma para calcular o desvio médio simples obedece aos mesmos critérios. A única diferença é que na variável contínua temos uma faixa de valores para classe, e não um valor definido. Para tanto, devemos, em cada classe, determinar o ponto médio.
Exemplo:
Classe intervalo de classe fi xi xi.fi
1 60 |------ 70 1 65 65
2 70 |------ 80 5 75 375
3 80 |------ 90 6 85 510
4 90 |------ 100 10 95 950
5 100 |------ 110 12 105 1260
6 110 |------ 120 19 115 2185
7 120 |------ 130 14 125 1750
8 130 |------ 140 3 135 405
Σ = 70 Σ = 7500
xx f
fi i
i= = =∑
∑.
,7500
70107 14
31
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
classe intervalo de classe fi xi xi.fi |xi- Xm| |xi- xm|.fi
1 60 |------ 70 1 65 65 42,14 42,14
2 70 |------ 80 5 75 375 32,14 160,7
3 80 |------ 90 6 85 510 22,14 132,84
4 90 |------ 100 10 95 950 12,14 121,4
5 100 |------ 110 12 105 1260 2,14 25,68
6 110 |------ 120 19 115 2185 7,86 149,34
7 120 |------ 130 14 125 1750 17,86 250,04
8 130 |------ 140 3 135 405 27,86 83,58
Σ = 70 Σ = 7500 Σ=965,72
DMSx x f
fi i
i=
−= =∑
∑. ,
,965 72
7013 75
Interpretação: o resultado obtido significa que cada elemento está, em média, 13,75 afastado de 107,14.
5.3 Variância e Desvio Padrão
Quando calculamos o desvio médio simples, utilizamos o módulo da diferença entre o valor de cada termo e a média a fim de interpretarmos a diferença como distância. Entretanto, há outra forma de obtermos as diferenças sempre positivas ou nulas, quando consideramos o quadrado dessas diferenças.
Isto é, em vez de usarmos a diferença
x xi −
usamos
x xi −( )2
32
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Assim, se substituirmos na fórmula do DMS a expressão x xi −( )2 , obteremos uma nova medida que chamaremos de
variância, que fica:
σ2
2
( )xx x
ni=−( )∑
A raiz desse valor é o que denominamos
σ σ( ) ( )x x= 2
Importante
Quando estivermos trabalhando com uma amostra, o valor da variância será dado por:
s xx x
ni2
2
1( )
( )=
−−
∑
E o desvio padrão será dado por:
s x S x( ) ( )= 2
Dados brutos ou Rol
Como foi visto anteriormente, se tivermos dados brutos, a primeira coisa a fazer é formarmos o Rol.
Obtido o Rol, passamos a determinar o valor médio dos termos que constam no Rol para, em seguida, calcularmos a variância e o desvio padrão.
33
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Exemplo:
Dada a distribuição
X: 3, 4, 5, 7, 8, 9
Temos que:
x = + + + + + = =3 4 5 7 8 96
366
6
Calculando x xi −( )2
, temos:
x x12 23 6 9−( ) = −( ) =
x x22 24 6 4−( ) = −( ) =
x x32 25 6 1−( ) = −( ) =
x x42 27 6 1−( ) = −( ) =
x x52 28 6 4−( ) = −( ) =
x x62 29 6 9−( ) = −( ) =
Então, a variância é:
σ2 9 4 1 1 4 96
286
4 66( ) ,x = + + + + + = =
34
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
E o desvio padrão é:
σ( ) , ,x = =4 66 2 16
Variável discreta
Inicialmente temos que os dados já vêm ordenados, mas como há elementos que se repetem, definimos a variância como a média aritmética ponderada dos quadrados dos desvios dos elementos da série para com a média.
Se a variável discreta representa uma população, a variância e o desvio padrão são calculados como:
σ22
( )( ) .
xx x f
fi i
i=
−∑∑
e σ σ( ) ( )x x= 2
Se for a representação de uma amostra, então teremos:
s xx x f
fi i
i
22
1( )
( ) .=
−−
∑∑
e s x s x( ) ( )= 2
Exemplo:
I xi fi xi.fi
1 0 4 0
2 3 2 6
3 4 3 12
4 6 8 48
5 7 4 28
6 8 1 8
7 9 2 18
Σ = 24 Σ = 120
x = =12024
5
35
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
I xi fi xi.fi (xi – xm)2 (xi – xm)2.fi
1 0 4 0 25 100
2 3 2 6 4 8
3 4 3 12 1 3
4 6 8 48 1 8
5 7 4 28 4 16
6 8 1 8 9 9
7 9 2 18 16 32
Σ = 24 Σ = 120 Σ = 176
Então:
σ22
17624
7 33( )( ) .
,xx x f
fi i
i=
−= =∑
∑e
σ σ( ) ( ) , ,x x= = =2 7 33 2 70
Considerando a tabela como a representação de uma amostra, temos:
s xx x f
fi i
i
22
117623
7 65( )( ) .
,=−
−= =∑
∑e
s x x( ) ( ) , ,= = =σ2 7 65 2 76
Variável contínua
Novamente, ao desconhecer um valor particular para uma faixa de variação da classe em uma variável contínua, a exemplo
36
Unidade I
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
de situações anteriores, consideramos o valor médio do intervalo de classe.
As fórmulas usadas para o cálculo da variância e do desvio padrão são as mesmas usadas para a variável discreta, levando-se em consideração o que foi dito anteriormente, isto é, para cada classe tomamos o valor médio do seu intervalo.
Exemplo:
Dada a distribuição:
Classe intervalo de classe fi xi xi.fi
1 6 |------ 8 5 7 35
2 8 |------ 10 1 9 9
3 10 |------ 12 6 11 66
4 12 |------ 14 19 13 247
5 14 |------ 16 12 15 180
6 16 |------ 18 10 17 170
7 18 |------ 20 3 19 57
8 20 |------ 22 4 21 84
Σ = 60 Σ = 848
Temos:
xx f
fi i
i= = =∑
∑.
,84860
14 13
classe intervalo de classe fi xi xi.fi (xi – xm)2 (xi – xm)2.fi
1 6 |------ 8 5 7 35 50,84 254,18
2 8 |------ 10 1 9 9 26,32 26,32
3 10 |------ 12 6 11 66 9,80 58,78
4 12 |------ 14 19 13 247 1,28 24,26
5 14 |------ 16 12 15 180 0,76 9,08
6 16 |------ 18 10 17 170 8,24 82,37
7 18 |------ 20 3 19 57 23,72 71,15
8 20 |------ 22 4 21 84 47,20 188,79
Σ = 60 Σ = 884 Σ = 714,93
37
ESTATÍSTICA E PROBABILIDADE
Revi
são:
Aile
en -
Dia
gram
ação
: Már
cio
- 10
/02/
11
Então,
σ22
714 9360
1191( )( ) . ,
,xx x f
fi i
i=
−= =∑
∑
e
σ σ( ) ( ) , ,x x= = =2 1191 3 45
Se a distribuição se tratasse de uma amostra, teríamos:
σ22
1714 93
5912 11( )
( ) . ,,x
x x f
fi i
i=
−−
= =∑∑
e
σ σ( ) ( ) , ,x x= = =2 12 11 3 47
Importante
No cálculo da variância, elevamos ao quadrado a diferença de um valor e a média da distribuição. Portanto, a unidade de medida também deve ser elevada ao quadrado.
O valor da variância não pode ser comparado diretamente com os dados da série, isto é, a variância não tem interpretação.
Para suprir esta deficiência é que se define o desvio padrão.
Interpretação do desvio padrão
O desvio padrão é a mais importante das medidas de dispersão. Quando a curva é perfeitamente simétrica, podemos afirmar que
Top Related