Estatistica[1]
-
Upload
tuane-paixao -
Category
Documents
-
view
3.948 -
download
0
Transcript of Estatistica[1]
O que é ESTATÍSTICA
• “Estatística é a Ciência de obter conclusões a partir de dados”. Paul Velleman
• A Estatística envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais.
• Dados => Informações => Decisões
1
O que é ESTATÍSTICA• Parte de perguntas/desafios do mundo REAL:
– cientistas querem verificar se uma nova vacina contra febre amarela faz efeito.
– um político quer saber qual é o percentual de eleitores que pretende votar nele nas próximas eleições.
– a Ford quer verificar a qualidade de um lote inteiro de peças fornecidas através de uma pequena amostra.
– o departamento de matemática da UFSC quer saber o percentual de alunos que aprovados na disciplina de Calculo III.
2
Por que usar Estatística?
• Por que a natureza apresenta VARIABILIDADE:– Variações de indivíduo para indivíduo;– Variações no mesmo indivíduo;
• “A Estatística estuda como controlar, minimizar e observar a variabilidade INEVITÁVEL de todas as medidas e observações”.
• Sem Métodos Estatísticos, sem validade científica!
3
ESTATÍSTICA DESCRITIVA
• A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem á ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação desses dados ficam a cargo da ESTATÍSTICA INDUTIVA OU INFERENCIAL
4
ESTATISTICA DESCRITIVA
5
População e Amostra
• População: conjunto de indivíduos com pelo menos uma característica observável(valores, pessoas, medidas)
• Se todos podem ser pesquisados: CENSO• Se não, pesquisa-se uma Amostra:Um subconjunto de
elementos extraídos de uma população
6
X1 X2 X3 ...
Subdivisões da Estatística
• AMOSTRAGEM: técnicas para obter uma amostra representativa, suficiente e que possa ser generalizada para a população.
• ANÁLISE EXPLORATÓRIA DE DADOS: técnicas para resumir, organizar e interpretar os dados, de uma amostra ou da população, para obter informações.
7
Subdivisões da Estatística
• INFERÊNCIA ESTATÍSTICA: técnicas para generalizar estatisticamente os resultados de uma amostra para a população.
• PROBABILIDADE: técnicas que permitem calcular a confiabilidade das conclusões de Inferência Estatística.
8
Variável: Qualquer característica associada a uma população.
• Classificação das variáveis:• QUALITATIVA: Nominal- Sexo, estado civil
Ordinal- Classe social, grau de instrução
• QUANTITATIVA: Discreta- Número de alunos
Contínua:Altura,peso,salário
9
Objetivos das pesquisas• Em última análise os objetivos das pesquisas consistem em
estudar o relacionamento entre variáveis na POPULAÇÃO.
• Magnitude e confiabilidade do relacionamento.
• O número de variáveis envolvidas, o seu nível de mensuração, quais são as “independentes” e as “dependentes”, o tipo de pesquisa (levantamento, experimento, censo ou amostragem) influenciarão na escolha das técnicas:– para coletar os dados;– para apresentar os dados;
10
Análise Exploratória de Dados
11
Variáveis qualitativas
Tabelas (freqüências ou percentuais)
Gráficos
Variáveis quantitativas
Tabelas (freqüências ou percentuais)
Gráficos
Medidas de síntese: média, mediana,
desvio padrão.
TIPOS DE GRAFICOS
• Os dados podem então ser representados de várias formas• Diagramas de barras:• È a representação de uma série por meio de retângulos,
dispostos verticalmente( em colunas) ou horizontalmente (em barras).
• Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.
• Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados.
12
GRAFICO DE BARRAS
13
GRÁFICO DE SETOR
• È construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado total.
• Representa os valores relativos( % )• Os setores são tais que suas áreas são respectivamente
proporcionais aos dados da série.• Obtemos cada setor por meio de regra de três simples e
direta, salientando que o total da série corresponde a 360°.
14
GRÁFICO DE SETOR
15
Polígono de freqüência
• Utilizado para indicar o ponto médio (Pm) ou representante de classe com suas respectivas freqüências absolutas, é construído sobre o histograma. Para construí-lo, procedemos assim:
• 1. No eixo X (abscissas), colocamos o ponto médio de cada intervalo de classe.
• 2. No eixo Y (ordenadas), permanecem as freqüências absolutas de classe (fi).
• 3. Ligamos os pontos por segmentos de reta.• 4. Para completar o polígono, acrescentamos um ponto
médio com freqüência zero em cada uma das extremidades da escala horizontal.
16
HISTOGRAMA
• Histograma /Poligono de Frequência
17
4
8
12
30 40 50 60 70 80 90 100
ni
DISTRIBUIÇÃO DE FREQUÊNCIA
• È UM TIPO DE TABELA QUE CONDENSA UMA COLEÇÃO DE DADOS CONFORME AS FREQUÊNCIAS
• Dados Brutos- É o conjunto dos dados numéricos obtidos após a coleta dos dados:
• Ex.: Idade dos alunos do curso de engenharia civil da UFBA, no ano de 2008.
• 24 23 22 28 35 21 23 33 3424 21 25 36 26 22 30 32 2526 33 34 21 31 25 31 26 2535 33 31
18
Rol - É o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente.
• Ex.: Utilizando os mesmos dados anteriores:• 21 21 21 22 22 23 23 24 25
25 25 25 26 26 26 28 3031 31 31 32 33 33 33 3434 34 35 35 36
• Arrumar os dados numa tabela de frequência por intervalo de classe
• Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.
19
• Limites de Classe - Os limites de classe são seus valores extremos. No exemplo anterior de distribuição de freqüência o valor 21 é denominado limite inferior da primeira classe, enquanto o valor 24 é denominado limite superior da primeira classe.
• Número de classes - É representado por k. É importante que a distribuição conte com um número adequado de classes. Para determinar o número de classes há diversos métodos. Nós aprenderemos duas soluções:
• Para n =< 25, K=
• Para n > 25, K= 1 + 3,3 . log N
30 5,4
20
Amplitude do Intervalo de Classe (h) - O intervalo de uma classe corresponde ao comprimento desta classe . Numericamente, sua amplitude pode ser definida como a diferença existente entre os limites superior
h = 24 – 21 = 3
Para construção de tabelas de freqüência para dados agrupados em classe, algumas definições far-se-ão a seguir:
21
IdadeFreqüências
(fi)
21 |--- 2424 |--- 2727 |--- 3030 |--- 3333 |---| 36
78159
Total 30
TIPOS DE FREQÜÊNCIAS• Freqüência Simples:
• - Freqüência Simples Absoluta ( fi ) - É o número de repetições de um valor individual ou de uma classe de valores da variável. Trata-se do caso visto até o presente momento.
• - Freqüência Simples Relativa ( fri )(%) - Representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações. Trata-se, portanto, de um número relativo.
• Freqüências Acumuladas:• - Freqüências Acumuladas (Fi) – É o total das freqüências
de todos os valores inferiores ao limite superior do intervalo de uma dada classe
22
Idade dos alunos do curso de engenharia civil da UFBA em 2008
23
Idadenº Alunos
( fi )fri fri (%) Fiab
21 |-- 2424 |-- 2727 |-- 3030 |-- 3333 |-- 36
78159
0,230,270,030,170,30
23273
1730
715162130
Total 30 1,00 100
Histograma
24
0
1
2
3
4
5
6
7
8
9
10
21 |--- 24 24 |--- 27 27 |--- 30 30 |--- 33 33 |---| 36
Fre
qü
ên
cia
Idade
Idade dos alunos do curso de engenharia civil da UFBA2008
MEDIDAS DE POSIÇÃO• É a parte da estatística que representam uma serie de dados
orientando-nos quanto a posição em relação ao eixo horizontal .São medidas de tendência central, visto que ocupam posições centrais numa distribuição
25
Moda: valor mais provável.
Média: ponto de equilíbrio do conjunto.
Mediana: divide o conjunto em duas partes iguais.
Media Aritmética
• È o quociente da divisão da È o quociente da divisão da soma dos valores da variável soma dos valores da variável pelo número delas.pelo número delas.
• Ex: Para os elementos Ex: Para os elementos 1,2,3,5,7,8 e 9, temos:1,2,3,5,7,8 e 9, temos:
___ixX
n
___
:
:
: vari
X médiaaritmética
n número de valores
x os valoresda iável
26
___ 1 2 3 5 7 8 9 355
7 7X
Média Aritmética PonderadaA média aritmética ponderada p de um conjunto de números x1, x2, x3, ..., xn cuja importância relativa ("peso") é respectivamente p1, p2, p3, ..., pn .Ex: Alcebíades participou de um concurso, onde foram realizadas provas de Português, Matemática, Biologia e História. Essas provas tinham peso 3, 3, 2 e 2, respectivamente. Sabendo que Alcebíades tirou 8,0 em Português, 7,5 em Matemática, 5,0 em Biologia e 4,0 em História, qual foi a média que ele obteve?
27
___ 8 3 7,5 3 5 2 4 2 64,5X 6,45
3 3 2 2 10p
x x x x
Mediana• A Mediana de um conjunto ordenado de valores é o valor
do meio deste conjunto, ou o valor médio dos dois valores centrais.• Observe-se que s Mediana divide o grupo ordenado de
valores em 2 partes iguais (50% acima e 50% abaixo da Mediana).• Se o número de itens é par, a Mediana será a media dos 2
valores do meio. Se o número de itens for ímpar, a Mediana será o valor do meio.
• EXEMPLO: Calcular a mediana para os seguintes conjuntos de dados:a) 10, 12, 12, 14, 15, 18, 19
• Posição da mediana = (7 + 1) / 2 = 4 ,a mediana é o 4º valor• Então o valor da mediana para estes dados é Md = 14.
b) 18, 19, 23, 25, 29, 30• Posição da mediana = (6 + 1) / 2 = 3,5 , a mediana é o valor
médio entre o 3º e o 4º valores, ou seja: Md = (23 + 25) / 2 = 24.
28
Moda
• A Moda é o valor mais freqüente num conjunto de valores.
• EXEMPLO: Verificar o valor da moda, para os seguintes conjuntos de dados:
• a) 12, 18, 20, 15, 12, 19, 15, 12. >>> Mo = 12• b) 15, 19, 21, 12, 15, 21, 17, 14. >>> Mo = 15 e Mo = 21• c) 12, 16, 13, 18, 20, 14, 25, 11 >>> amodal.
29
Idade dos alunos do curso de engenharia civil da UFBA em 2008
30
Idade
21 |--- 2424 |--- 2727 |--- 3030 |--- 3333 |---| 36
Total
Freqüências(fi)
78159
30
Ponto Médio(xi)
fi . xiFA
22,525,528,531,534,5
157,520428,5
157,5310,5
715162130
---- 858 ---
31
MÉDIA PARA DADOS TABULADOS AGRUPADOS EM CLASSES:
21 2422,5
2 2. 858
28,630
i
i i
i
Li Lsx
f xX
f
MEDIANA PARA DADOS TABULADOS AGRUPADOS EM CLASSES
3015
2 2( )
.
(15 7)24 3. 24
8
iMd
Md
fP
P FacMd Li h
fi
Md
32
IdadeFreqüências
(fi)
21 |--- 2424 |--- 2727 |--- 3030 |--- 3333 |---| 36
78159
Total 30
FA
715162130
---
Interpretação: 50% dos alunos possuem idades iguais ou inferiores a 27 anos.Ou 50% dos alunos possuem idades iguais ou superiores a 27 anos.
33
MODA
Em uma distribuição de freqüência por classes de valores, de uma forma bastante simples, podemos encontrar a moda pela seguinte fórmula:
2
hlM io
23
33 34,52
hMo Li
Mo