Post on 22-Apr-2015
NOÇÕES BÁSICAS DE ESTATÍSTICA
Estatística descritiva É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe o quão freqüente é o uso de médias, índices e gráficos nas notícias.
Estatística inferencial (ou indutiva) A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da amostra, constitui o problema central da inferência estatística.
Tipos de Estatísticas
TERMOS DE UMA PESQUISA ESTATÍSTICAPopulação e amostra
Um total de elementos descreve o universo estatístico, como nem sempre é possível consultar a todos, recorremos, então, ao que se chama de amostra, ou seja, um grupo de elementos que consultados, permitem que se chegue a um resultado mais próximo da realidade.
A amostra pode ser um indivíduo ou um objeto.
TIPOS DE AMOSTRAS Amostragem casual ou aleatória simples: É o
processo mais elementar e freqüentemente utilizado. É equivalente a um sorteio lotérico.
Amostragem proporcional estratificada: Quando a população se divide em estratos (subpopulações)
Amostragem sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc.
Amostragem por conglomerados (ou agrupamentos): Algumas populações não permitem ou tornam extremamente difícil que se identifiquem seus elementos. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios, etc.
Amostragem acidental: Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.
Amostragem intencional: De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irá compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião.
Amostragem por quotas: Um dos métodos de amostragem mais comumente usado em levantamentos de mercado e em prévias eleitorais.
Variável
contínua
discretavaquantitati
ordinal
alnoaqualitativ
Variável
min
Variável qualitativa nominal são valores que estão relacionados a uma qualidade ou atributo dos elementos pesquisados sem uma ordem nos seus valores.
Ex: cor de cabelo ou esporte favorito
Variável qualitativa ordinal são valores que estão relacionados a uma qualidade ou atributo dos elementos pesquisados com uma ordem nos seus valores
Ex: grau de instrução: fundamental, médio, superior, etc.
Variável quantitativa discreta são valores que estão relacionados a números, se tratando de contagem (números inteiros)
Ex: Número de irmãos: 0, 1, 2, etc.
Variável quantitativa contínua são valores que estão relacionados a números, se tratando de medidas (números reais)
Ex: Altura:1,55 m, 1,80 m, etc.
ROL E AMPLITUDE
Rol: É o arranjo dos dados Brutos em ordem crescente ou decrescentes.
Amplitude total: É a diferença o maior e o menor dos valores observados.
FREQÜÊNCIA ABSOLUTA(FA) E FREQÜÊNCIA RELATIVA (FR)
O número de vezes que um valor de uma variável é citado representa a freqüência absoluta daquele valor.
A freqüência relativa é a que registra a freqüência absoluta em relação ao total de citações.
Ex: Suponha que entre um grupo de turistas,
participantes de uma excursão, tenha sido feita uma pesquisa sobre a nacionalidade de cada um e que o resultado dela tenha sido o seguinte:
Pedro: brasileiro; Ana: brasileira; Ramón:
espanhol; Laura: espanhola; Cláudia: brasileira; Sergio: brasileiro; Raul: argentino; Nélson: brasileiro; Sílvia: brasileira; Pablo: espanhol.
Nesse exemplo, a variável é a
“nacionalidade”, os valores são: “brasileira, espanhola e argentina”.
Nacionalidade Freqüência Absoluta (FA)
Freqüência Relativa (FR)
Brasileira 6 ou 0,6 ou 60%
Espanhola 3 ou 0,3 ou 30%
Argentina 1 ou 0,1 ou 10%
Total 10 ou 1 ou 100%
10
6
10
3
10
1
10
10
REPRESENTAÇÃO GRÁFICAGráficos de segmentos
Os gráficos de segmentos são utilizados principalmente para mostrar a evolução das freqüências dos valores de uma variável durante certo período.
A tabela abaixo mostra a venda de livros em uma livraria no segundo semestre de determinado ano.
Com base na tabela temos o gráfico de segmentos
Gráficos de barras
Com base no “desempenho em Química” demonstrando pelos alunos de uma classe, um professor elaborou a seguinte tabela:
Com os dados da tabela é possível construir o gráfico de barras
Gráficos de setores (ou gráfico “pizza”)
Em um shopping há três salas de cinema, e o número de espectadores em cada uma delas num determinado dia da semana foi de 300 na sala A, 200 na B e 500 na C.
Observe a tabela de freqüências e depois em gráficos de setores:
Em cada gráfico de setores o círculo todo indica o total (1000 espectadores ou 100%) e cada setor indica a ocupação de uma sala.
Na construção do gráfico de setores, determina-se o ângulo correspondente a cada setor por regra de três. Veja como exemplo o da sala A
Usando a freqüência absoluta,
1083601000
300x
x
Usando a freqüência relativa (em %),
108360100
30x
x
MEDIDAS DE TENDÊNCIA CENTRAL
Considerando um grupo de pessoas com 22, 20, 21, 24 e 20 anos, temos que:
4,215
107
5
2024212022
MA
.
Assim, a média aritmética ou a média da idade do grupo é 21,4 anos.
Logo de forma geral temos: n
x
n
xxxxMA
n
ii
n
1321 ...
Média aritmética (MA)
MÉDIA PONDERADA
MODA (MO)
Moda é a medida de tendência central definida como o valor mais freqüente de um grupo de valores observados. Ex: 1) Do grupo de pessoas com idades de 2, 3, 2, 1, 2 e 50 anos, a moda é 2 anos
(Mo = 2). Observação: Quando não há repetição de números, como, por exemplo, para 7, 9, 4, 5
e 8, não há moda.
MEDIANA (ME)Dados n números em ordem crescente ou decrescente, a mediana será:
O número que ocupar a posição central se n for ímpar; Ex: Numa classe, foram anotadas as faltas durante um período de 15 dias: 3, 5, 2, 0, 2, 1, 3, 4, 5, 7, 0, 2, 3, 4 e 7 Em ordem crescente, temos:
3
,7,7,5,5,4,4,3,3,3,2,2,2,1,0,077
Mevaloresvalores
A média aritmética dos dois números que estiverem no centro se n for par.
Ex: As idades dos alunos de uma equipe são 12, 16, 14, 12, 13, 16, 16 e 17 anos Colocamos inicialmente na ordem crescente ou decrescente:
17,16,16,16,14,13,12,12centraisposiçõesduasAs
152
1614
Me
MEDIDAS DE DISPERSÃO
As medidas de dispersão são usadas quando as medidas de tendência central são insuficientes.
Variância (V)
É dado pela fórmula n
MAxV
n
ii
1
2)(
e é suficiente
para diferenciar a dispersão das variáveis
Desvio Padrão (DP)
É a raiz quadrada da variância VDP . Ele facilita a interpretação dos dados da variância.
Observe a seguinte situação:
Uma pessoa é encarregada de organizar atividades de lazer para um grupo de 6 pessoas e recebe a informação de que a média de idade do grupo é 20 anos. Nesse caso, apenas a informação da média não é suficiente para planejar as atividades, pois podemos ter grupos com média de idade de 20 anos e características totalmente diferentes.
Observemos alguns grupos possíveis:
Grupo A: 20 anos; 20 anos; 20 anos; 20 anos; 20 anos; 20 anos.
anosMA 206
120
6
202020202020
Grupo B: 22 anos; 23 anos; 18 anos; 19 anos; 20 anos; 18 anos.
anosMA 206
120
6
182019182322
Grupo C: 6 anos; 62 anos; 39 anos; 4 anos; 8 anos; 1 ano.
anosMA 206
120
6
18439626
Neste tipo de situação devemos usar as medidas de dispersão pois o
grupo C é um exemplo claro de um grupo heterogêneo.
O cálculo da variância e do desvio padrão dos grupos acima é dado por:
Grupo A: 20 anos; 20 anos; 20 anos; 20 anos; 20 anos; 20 anos
MA = 20
Desvios: 02020 , todos iguais a zero
V = 0
0DP = 0 ano
Grupo B: 22 anos; 23 anos; 18 anos; 19 anos; 20 anos; 18 anos.
MA = 20
Desvios: 22022 ; 32023 ; 22018 ; 12019 ; 02020 ; 22018
6,36
22
6
401494
6
)2(0)1()2(32 222222
V
9,16,3 DP anos
Grupo C: 6 anos; 62 anos; 39 anos; 4 anos; 8 anos; 1 ano. MA = 20
Desvios: 14206 ; 422062 ; 192039 ; 16204 ; 12208 ; 19201
6
3611442563611764196
6
)19()12()16(1942)14( 222222
V
6,5136
3082
6,226,513 DP anos