Análise de Correlação e Regressão
-
Upload
api-3704647 -
Category
Documents
-
view
13.083 -
download
4
Transcript of Análise de Correlação e Regressão
Correlação e RegressãoCorrelação e Regressão
Prof.: Evaldo Márcio
Relação entre variáveis
Procuramos identificar a relação entre duas variáveis, como por exemplo: – o peso pode estar relacionado com a idade das pessoas;– o consumo das famílias pode estar relacionados com sua renda;– a venda de um produto pode estar relacionado à quantidade de anúncios/propaganda;– a demanda pode estar relacionada com o preço.
A existência de relação entre as variáveis e grau de relação é o que caracteriza o objeto da CORRELAÇÃO. Uma vez caracterizada, procura-se descrever uma relação sob forma matemática, através de uma função. A estimação dos parâmetros dessa função matemática é o objeto da REGRESSÃO.
Correlação Linear Simples
O estudo da correlação tem por objetivo medir e avaliar o grau de relação existente entre duas variáveis aleatórias.
Assim, podemos medir se a relação entre os nºs de filhos de uma família à sua renda é forte, fraca ou nula.
Variável independente será a variável X
Variável dependente será a variável Y
Um dos instrumentos de medida da correlação linear simples é dado pelo coeficiente de correlação de PEARSON:
y
r =X,Y
XY - (X) (Y) n .
Y² - (Y)² . X² - (X)² n n
Syy
Sxy
r =X,Y
XY - (X) (Y) n .
X² - (X)² . Y² - (Y)² n n
Correlação Linear Simples
Sxx
É uma variação entre os elementos
de X e Y.
É uma variação dos elementos de X e de Y.
Correlação Linear Positiva
A correlação será positiva se os valores crescentes de X estiverem
associados a valores crescentes de Y, ou valores decrescente de
X estiverem associados a valores decrescentes da variável Y.
0 < rXY < 1
x
y
Correlação Linear Perfeita Positiva
Acontece quando o os pontos X e Y estão perfeitamente alinhados.
rXY = 1
x
y
Correlação Negativa
A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de
X associados a valores crescentes da variável Y.
-1 < rXY < 0
x
y
Correlação Perfeita Negativa
Quando os pontos estiverem perfeitamente alinhados, mas em sentido contrário.
rXY = 1
x
y
Correlação Nula
Quando não houver relação entre as variáveis X e Y, ou seja,
quando as variações de X e Y ocorrerem independentemente não existe correlação entre elas.
rXY = 0
x
y
Os diagramas mostram que a correlação poderá ser:
0 0,5 1-0,5-1 0,75-0,75
FORTE quando rXY > 0,75
MÉDIA quando 0,5 < rXY 0,75
FRACA quando rXY 0,5
Exercício 1
Certa empresa estudando a variação da demanda de seu produto em relação à variação de preço de venda, obteve a tabela: a) Desenhe o gráfico de dispersão;b) Determine o coeficiente de correlação;c) Determine a reta ajustada;d) Determine o coeficiente de determinação R².
Vamos analisar o que já vimos neste exercício:
123456789
10
PREÇO (X) DEMANDA (Y)38 35042 32550 29756 27059 25663 24670 23880 22395 215
110 208
663 2628
Podemos observar :• Que a medida que o preço aumenta a demanda diminui, ou seja, os
valores crescente da variável X estão associados aos valores
decrescente da variável Y;• Então já podemos analisar que a Correlação será NEGATIVA.
Desenho do Gráfico de DispersãoDesenho do Gráfico de Dispersão
DEMANDA (Y)
0
100
200
300
400
500
0 20 40 60 80 100 120
PREÇO (X)
Y = a + bx
1
2
3
4
5
6
7
8
9
10
X.Y13.300 13.650 14.850 15.120 15.104 15.498 16.660 17.840 20.425 22.880
165.327
PREÇO (X)
DEMANDA (Y)
38 35042 32550 29756 27059 25663 24670 23880 22395 215
110 208663 2628
X²1.444 1.764 2.500 3.136 3.481 3.969 4.900 6.400 9.025
12.100 48.719
Y²122.500 105.625
88.209 72.900 65.536 60.516 56.644 49.729 46.225 43.264
711.148
Determine o Coeficiente de CorrelaçãoDetermine o Coeficiente de Correlação
r =X,Y
XY - (X) (Y) n .
Y² - (Y)² . X² - (X)² n n
Achando o Coeficiente de CorrelaçãoAchando o Coeficiente de Correlação
APLICA-SE A FÓRMULA : r =X,Y
XY - (X) (Y) n .
Y² - (Y)² . X² - (X)² n n
PREÇO (X) DEMANDA (Y) X² Y² X.Y
663 2628 48719 711148 165327
165.327 - 663 . 2.628 10 .
. 711.148 - (2.628)² . 48.719 - (663)² 10 10
r =X,Y
r =X,Y
- 8.909,40 9.882,75
r =X,Y
- 0,9015
A Correlação entre
o PREÇO e a DEMANDA é
FORTE E NEGATIVAr =X,Y
- 8.909,40 . 20.509,60 . 4.762,10
Correlação Ordinal
Uma medida alternativa da correlação é dada pelo coeficiente de Spearman, que leva em conta as posições que os valores das variáveis ocupam ordenados na forma crescente ou decrescente.
26
1( ² 1)
idrn n
Análise de Regressão
A análise de regressão tem por objetivo descrever através de um modelo matemático, a relação existente entre duas variáveis, a partir de n observações dessas variáveis.
A variável Y é a variável aleatória que é explicada pela variável X.
A reta ajustada é representada por = a + bx onde a e b são os parâmetros do modelo.
Análise de Regressão
Para obter o valores de a e b usaremos as fórmulas abaixo :
b = YX - Y X n _ X² - (X)² n
a = Y - b X n n
Depois que achar os valores de a e de b substitui na equação da reta
Determinando a reta ajustadaDeterminando a reta ajustada
1º PASSO : achar o valor do coeficiente b
b =
YX - Y X n _ X² - (X)² n
a = Y - b X n n
2º PASSO : achar o valor do coeficiente a
Observe que já calculamos no
exercício anterior algumas variáveis.
SxySxx
b =
-8.909,40 4.762,10b = b = -1,87
2.628 - (-1,87) . 663 10 10a =
a = 386,78
= a + bx
= 386,78 + -1,87x
3º PASSO :
Achando os valores da equação ajustadaAchando os valores da equação ajustada
PREÇO (X)
DEMANDA (Y) X² Y² X.Y
RETA AJUSTADA
1 38 350 1.444 122.500 13.300 315,72 2 42 325 1.764 105.625 13.650 308,24 3 50 297 2.500 88.209 14.850 293,28 4 56 270 3.136 72.900 15.120 282,06 5 59 256 3.481 65.536 15.104 276,45 6 63 246 3.969 60.516 15.498 268,97 7 70 238 4.900 56.644 16.660 255,88 8 80 223 6.400 49.729 17.840 237,18 9 95 215 9.025 46.225 20.425 209,13
10 110 208 12.100 43.264 22.880 181,08 663 2.628 48.719 711.148 165.327 2.627,99
= 386,78 + (-1,87). 38 = 315,72
= 386,78 + -1,87x
= 386,78 + (-1,87). 42 = 308,24
e assim.... até o último valor.
Incluindo os valores da reta Incluindo os valores da reta ajustadaajustada
0
50
100
150
200
250
300
350
400
0 20 40 60 80 100 120
PREÇO (X)
Y = a + bx Y = a + bx
Coeficiente de Determinação
O coeficiente de determinação tem por objetivo avaliar a qualidade do ajuste.
Podemos observar que quanto mais próximo de zero pior será o ajuste; quanto mais próximo de 1 ou 100 melhor será o ajuste.
OU 1 - ( y - y )²
n y² - (y)²
^R² =
b² . Sxx
SyyR² =
b² . Sxy
SyyR² =OU
0 < R² 10 < R² 1Pior
AJUSTEMelhor
AJUSTE
Achando o Coeficiente de Achando o Coeficiente de DeterminaçãoDeterminação
R² = 0,8119
R² = 0,81
O ajuste é BOM, porque em em 81% dos casos a variável de
demanda explica a variável de preço, sendo o restante explicado
por outra varáveis.Ex.: tipo de produto; qualidade no
serviço, etc.
b² . SXX
SYYR² =
(-1,87)² . 4.762,10 20.509,60
R² =
Exercício 2
Foi feito um estudo com 40 mulheres em duas cidades e obteve-se as seguintes equações de regressão e seus
respectivos de determinação. Cidade A Cidade BY = 80,78+1,138x Y = 50,79 + 2,311xR² = 0,90 R² = 0,77
Sabe-se que a variável X indica as idades das mulheres e Y suas respectivas pressões arteriais. Com base nessas informações responda:
a) Qual será a pressão arterial de uma mulher de 45 anos nas respectivas cidades?
b) Na sua opinião qual é o melhor modelo ajustado?
Justifique sua resposta! O modelo ajustado na cidade A é o que explica melhor o fenômeno pressão arterial em função da idade, pois na cidade A em 90% dos casos de pressão arterial é explicada em função da variável idade; enquanto que na cidade B em mais de 77% dos casos a variável pressão arterial é explicada em função da idade.
Cidade A Y= 80,78 + 1,138xY= 80,78 + 1,138 . 45Y= 131,99 pressão arterial
Cidade BY = 50,79 + 2,311xY = 50,79 + 2,311. 45Y = 154,78 pressão arterial
De acordo com os valores acima determine:
a) Qual o valor da Correlação? Interprete esse resultado;b) Qual é a reta de regressão? Interprete esse resultado;c) Na sua opinião o modelo ajustado é bom? Justifique
sua resposta!
Exercício 3
a) r= 0,9971Interpretação: A correlação é FORTE E POSITIVA entre as variáveis de demanda e o tempo da empresa no mercado.
b) y= a+bxy= 1,1920 + 4,2954 x
É a reta de regressão quanto ao resultado podemos analisar que na abertura da empresa, ou seja, o tempo igual a 0 (zero) , a demanda inicial da empresa será de 1,2, de acordo com a variável tempo da empresa no mercado multiplicado por da 4,3 + a demanda inicial que é 1,2 , estaremos definidos a demanda atual.
c) R² = 0,9943O modelo ajustado é BOM, porque em mais de 99% dos casos a variável demanda é explicada pelo tempo da empresa no mercado e o restante por outras variáveis a saber. Ex.: localidade da empresa, qualidade no serviço, tempo de produto etc.
d) calcule os valores previstos para a demanda e os seus respectivos erros, usando o modelo ajustado e os valores dos tempos das empresas no mercado descritos abaixo.
ANÁLISE DOS RESÍDUOS (ERROS)
-20
-15
-10
-5
0
5
10
15
0 5 10 15 20 25
TEMPO
RE
SÍD
UO
S
RESÍDUOS
TEMPO DA EMPRESA NO MERCADO
DEMANDA RESÍDUOS ( y – y )
4 29,37 18,37 11
5 26,67 22,67 4
6 27,96 26,96 1
8 39,55 35,55 4
10 46,14 44,14 2
12 45,74 52,74 -7
15 58,62 65,62 -7
20 72,10 87,1 -15
80 346,15 344,82 5
y
( y-y ) = ry – 18,37 = 11Então:Y = y + rY = 18,37 + 11 = 29