1/39
Análise do grau de
relacionamento entre duas variáveis quantitativas.
Correlação
2/39
Renda e consumo. Salário e produtividade de funcionários. Risco e rentabilidade de ações. Renda familiar e número de filhos.
Correlação:Exemplos
3/39
Peso e altura de pessoas. Volume de produção e custos. Gastos com prevenção de defeitos e falhas nos produtos.
Correlação:Exemplos
4/39
Dados de 12 municípios de SC.
Exemplo
5/39
Variáveis observadas:
População do município, em 1000 habitantes. População urbana, em 1000 habitantes. % de população urbana. taxa de crescimento demográfico, em %. taxa de mortalidade infantil: coeficiente de
mortalidade por 1000 nascidos vivos. taxa de alfabetização, em %.
Exemplo
6/39
muni-cípio
popu-lação
popul.urbana
% pop.urbana
taxa decrescim.
taxa mort.infantil
taxa dealfabet.
1 101 94 93 3,19 37 852 193 181 94 4,60 27 903 42 39 94 2,78 38 854 304 292 96 6,46 25 875 42 32 76 1,99 67 756 152 126 83 1,89 63 787 55 36 66 2,92 41 818 105 77 73 5,32 13 759 68 25 37 2,71 28 84
10 219 186 85 3,11 17 8711 129 116 90 3,11 32 8512 42 33 78 1,21 32 77
Exemplo
7/39
população residente x população urbana
0
100
200
300
0 100 200 300 400população residente (x 1000)
popu
laçã
o ur
bana
(x 1
000)
Diagrama de Dispersão
8/39
população residente x taxa de crescimento
Diagrama de Dispersão
0
2
4
6
8
0 100 200 300 400população residente (x 1000)ta
xa d
e cr
esci
men
to
dem
ográ
fico
9/39
taxa de crescimento x taxa mortalidade infantil
0
20
40
60
80
0 2 4 6 8taxa de crescimento demográficota
xa d
e m
orta
lidad
e in
fant
ilDiagrama de
Dispersão
10/39
% de pop. urbana x taxa de mortalidade infantil
Diagrama de Dispersão
0
20
40
60
80
30 50 70 90 110
% de população urbana
taxa
de
mor
talid
ade
infa
ntil
11/39
% de população urbana x taxa de alfabetização
Diagrama de Dispersão
70
75
80
85
90
70 80 90 100
% de população urbana
taxa
de
alfa
betiz
ação
30 40 50 60
12/39
Correlação não Linear
Y
X
13/39
Descrição da correlação linear entre 2 variáveis quantitativas.
Para a construção do coeficiente, primeiramente deve-se padronizar as duas variáveis (X e Y).
Coeficiente de Correlação de
Pearson
14/39
Com isso, a origem dos eixos é deslocada para o ponto médio (X, Y) e as unidades de medida são desconsideradas.
Coeficiente de Correlação de
Pearson
xSXx'x
ySYy'y
15/39
Y
X
Y’
X’Y
X
Coeficiente de Correlação de
Pearson
16/39
Sinal do produto (x’ y’)
X’
Y’
++ --
Coeficiente de Correlação de
Pearson
17/39
Correlação Linear Positiva
(x’ y’) > 0
X’
Y’
18/39
Correlação Linear Negativa
(x’ y’) < 0
X’
Y’
19/39
Falta de
Correlação Linear
(x’ y’) = 0
X’
Y’
20/39
ou
r = (x’.y’)n - 1
r = n.x.y) - (x).(y)
n.x2) - (x)2 n.y2) - (y)2
Coeficiente de Correlação de
Pearson
21/39
< <-1 r 1
-1 0 1
correlaçãonegativaperfeita
não existecorrelaçãolinear
correlaçãopositivaperfeita
Coeficiente de Correlação de
Pearson
22/39
23/39
24/39
Estímulo x idade
25/39
Em estatística, regressão é uma técnica que
permite explorar e inferir a relação de uma variável dependente (variável de resposta) com variáveis independentes específicas (variáveis explicatórias).
A análise da regressão pode ser usada como um método descritivo da análise de dados (como, por exemplo, o ajustamento de curvas). Regressão designa também uma equação matemática que descreva a relação entre duas ou mais variáveis.
Regressão
26/39
Ou seja:
metodologia estatística que estuda (modela) a relação entre duas ou mais variáveis
Regressão
27/39
28/39
29/39
Em estatística ou econometria, regressão
linear é uma equação para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x.
A regressão, em geral, trata da questão de se estimar um valor condicional não esperado.
Regressão linear
30/39
A regressão linear é chamada "linear" porque se
considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear. Sendo uma das primeiras formas de análise regressiva a ser estudada rigorosamente, e usada extensamente em aplicações práticas. Isso acontece porque modelos que dependem de forma linear dos seus parâmetros desconhecidos, são mais fáceis de ajustar que os modelos não-lineares aos seus parâmetros, e porque as propriedades estatísticas dos estimadores resultantes são fáceis de determinar.
Regressão linear
31/39
Custo total Y
Produção X
80 1244 451 670 11 61 8
32/39
| Para se estimar o valor esperado, usa-
se de uma equação, que determina a relação entre ambas as variáveis.
Em que:
Equação da Regressão Linear
33/39
- Variável explicada (dependente); é o valor
que se quer atingir; - É uma constante, que representa a
interceptação da reta com o eixo vertical; - É outra constante, que representa o
declive(coeficiente angular)da reta; - Variável explicativa (independente),
representa o fator explicativo na equação;
Equação da Regressão Linear
34/39
35/39
36/39
37/39
SPSS
38/39
39/39
Top Related