Análise de Correlação e Regressão

30
Correlação e Regressão Correlação e Regressão Prof.: Evaldo Márcio

Transcript of Análise de Correlação e Regressão

Page 1: Análise de Correlação e Regressão

Correlação e RegressãoCorrelação e Regressão

Prof.: Evaldo Márcio

Page 2: Análise de Correlação e Regressão

Relação entre variáveis

Procuramos identificar a relação entre duas variáveis, como por exemplo: – o peso pode estar relacionado com a idade das pessoas;– o consumo das famílias pode estar relacionados com sua renda;– a venda de um produto pode estar relacionado à quantidade de anúncios/propaganda;– a demanda pode estar relacionada com o preço.

A existência de relação entre as variáveis e grau de relação é o que caracteriza o objeto da CORRELAÇÃO. Uma vez caracterizada, procura-se descrever uma relação sob forma matemática, através de uma função. A estimação dos parâmetros dessa função matemática é o objeto da REGRESSÃO.

Page 3: Análise de Correlação e Regressão

Correlação Linear Simples

O estudo da correlação tem por objetivo medir e avaliar o grau de relação existente entre duas variáveis aleatórias.

Assim, podemos medir se a relação entre os nºs de filhos de uma família à sua renda é forte, fraca ou nula.

Variável independente será a variável X

Variável dependente será a variável Y 

Um dos instrumentos de medida da correlação linear simples é dado pelo coeficiente de correlação de PEARSON:

 

 

y

r =X,Y

XY - (X) (Y) n .

Y² - (Y)² . X² - (X)² n n

Page 4: Análise de Correlação e Regressão

Syy

Sxy

r =X,Y

XY - (X) (Y) n .

X² - (X)² . Y² - (Y)² n n

Correlação Linear Simples

Sxx

É uma variação entre os elementos

de X e Y.

É uma variação dos elementos de X e de Y.

Page 5: Análise de Correlação e Regressão

Correlação Linear Positiva

A correlação será positiva se os valores crescentes de X estiverem

associados a valores crescentes de Y, ou valores decrescente de

X estiverem associados a valores decrescentes da variável Y.

0 < rXY < 1

x

y

Page 6: Análise de Correlação e Regressão

Correlação Linear Perfeita Positiva

 

Acontece quando o os pontos X e Y estão perfeitamente alinhados.

 

rXY = 1

 

x

y

Page 7: Análise de Correlação e Regressão

Correlação Negativa

 

A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de

X associados a valores crescentes da variável Y.

 

-1 < rXY < 0

x

y

Page 8: Análise de Correlação e Regressão

Correlação Perfeita Negativa

 Quando os pontos estiverem perfeitamente alinhados, mas em sentido contrário.

 

rXY = 1 

x

y

Page 9: Análise de Correlação e Regressão

Correlação Nula

 

Quando não houver relação entre as variáveis X e Y, ou seja,

quando as variações de X e Y ocorrerem independentemente não existe correlação entre elas.

 

rXY = 0

x

y

Page 10: Análise de Correlação e Regressão

Os diagramas mostram que a correlação poderá ser:

0 0,5 1-0,5-1 0,75-0,75

FORTE quando rXY > 0,75

MÉDIA quando 0,5 < rXY 0,75

FRACA quando rXY 0,5

Page 11: Análise de Correlação e Regressão

Exercício 1

Certa empresa estudando a variação da demanda de seu produto em relação à variação de preço de venda, obteve a tabela: a)       Desenhe o gráfico de dispersão;b)       Determine o coeficiente de correlação;c)       Determine a reta ajustada;d)       Determine o coeficiente de determinação R².

Page 12: Análise de Correlação e Regressão

Vamos analisar o que já vimos neste exercício:

123456789

10

PREÇO (X) DEMANDA (Y)38 35042 32550 29756 27059 25663 24670 23880 22395 215

110 208

663 2628

Podemos observar :• Que a medida que o preço aumenta a demanda diminui, ou seja, os

valores crescente da variável X estão associados aos valores

decrescente da variável Y;• Então já podemos analisar que a Correlação será NEGATIVA.

Page 13: Análise de Correlação e Regressão

Desenho do Gráfico de DispersãoDesenho do Gráfico de Dispersão

DEMANDA (Y)

0

100

200

300

400

500

0 20 40 60 80 100 120

PREÇO (X)

Y = a + bx

Page 14: Análise de Correlação e Regressão

1

2

3

4

5

6

7

8

9

10

X.Y13.300 13.650 14.850 15.120 15.104 15.498 16.660 17.840 20.425 22.880

165.327

PREÇO (X)

DEMANDA (Y)

38 35042 32550 29756 27059 25663 24670 23880 22395 215

110 208663 2628

X²1.444 1.764 2.500 3.136 3.481 3.969 4.900 6.400 9.025

12.100 48.719

Y²122.500 105.625

88.209 72.900 65.536 60.516 56.644 49.729 46.225 43.264

711.148

Determine o Coeficiente de CorrelaçãoDetermine o Coeficiente de Correlação

r =X,Y

XY - (X) (Y) n .

Y² - (Y)² . X² - (X)² n n

Page 15: Análise de Correlação e Regressão

Achando o Coeficiente de CorrelaçãoAchando o Coeficiente de Correlação

APLICA-SE A FÓRMULA : r =X,Y

XY - (X) (Y) n .

Y² - (Y)² . X² - (X)² n n

PREÇO (X) DEMANDA (Y) X² Y² X.Y

663 2628 48719 711148 165327

165.327 - 663 . 2.628 10 .

. 711.148 - (2.628)² . 48.719 - (663)² 10 10

r =X,Y

r =X,Y

- 8.909,40 9.882,75

r =X,Y

- 0,9015

A Correlação entre

o PREÇO e a DEMANDA é

FORTE E NEGATIVAr =X,Y

- 8.909,40 . 20.509,60 . 4.762,10

Page 16: Análise de Correlação e Regressão

Correlação Ordinal  

Uma medida alternativa da correlação é dada pelo coeficiente de Spearman, que leva em conta as posições que os valores das variáveis ocupam ordenados na forma crescente ou decrescente.

26

1( ² 1)

idrn n

Page 17: Análise de Correlação e Regressão

Análise de Regressão

 A análise de regressão tem por objetivo descrever através de um modelo matemático, a relação existente entre duas variáveis, a partir de n observações dessas variáveis.

A variável Y é a variável aleatória que é explicada pela variável X.

A reta ajustada é representada por = a + bx onde a e b são os parâmetros do modelo.

Page 18: Análise de Correlação e Regressão

Análise de Regressão 

Para obter o valores de a e b usaremos as fórmulas abaixo : 

 

b = YX - Y X n _ X² - (X)² n

a = Y - b X n n

Depois que achar os valores de a e de b substitui na equação da reta

Page 19: Análise de Correlação e Regressão

Determinando a reta ajustadaDeterminando a reta ajustada

1º PASSO : achar o valor do coeficiente b

b =

YX - Y X n _ X² - (X)² n

a = Y - b X n n

2º PASSO : achar o valor do coeficiente a

Observe que já calculamos no

exercício anterior algumas variáveis.

SxySxx

b =

-8.909,40 4.762,10b = b = -1,87

2.628 - (-1,87) . 663 10 10a =

a = 386,78

= a + bx

= 386,78 + -1,87x

3º PASSO :

Page 20: Análise de Correlação e Regressão

Achando os valores da equação ajustadaAchando os valores da equação ajustada

PREÇO (X)

DEMANDA (Y) X² Y² X.Y

RETA AJUSTADA

1 38 350 1.444 122.500 13.300 315,72 2 42 325 1.764 105.625 13.650 308,24 3 50 297 2.500 88.209 14.850 293,28 4 56 270 3.136 72.900 15.120 282,06 5 59 256 3.481 65.536 15.104 276,45 6 63 246 3.969 60.516 15.498 268,97 7 70 238 4.900 56.644 16.660 255,88 8 80 223 6.400 49.729 17.840 237,18 9 95 215 9.025 46.225 20.425 209,13

10 110 208 12.100 43.264 22.880 181,08 663 2.628 48.719 711.148 165.327 2.627,99

= 386,78 + (-1,87). 38 = 315,72

= 386,78 + -1,87x

= 386,78 + (-1,87). 42 = 308,24

e assim.... até o último valor.

Page 21: Análise de Correlação e Regressão

Incluindo os valores da reta Incluindo os valores da reta ajustadaajustada

0

50

100

150

200

250

300

350

400

0 20 40 60 80 100 120

PREÇO (X)

Y = a + bx Y = a + bx

Page 22: Análise de Correlação e Regressão

Coeficiente de Determinação

 O coeficiente de determinação tem por objetivo avaliar a qualidade do ajuste.

Podemos observar que quanto mais próximo de zero pior será o ajuste; quanto mais próximo de 1 ou 100 melhor será o ajuste.  

 

OU 1 - ( y - y )²

n y² - (y)²

^R² =

b² . Sxx

SyyR² =

b² . Sxy

SyyR² =OU

0 < R² 10 < R² 1Pior

AJUSTEMelhor

AJUSTE

Page 23: Análise de Correlação e Regressão

Achando o Coeficiente de Achando o Coeficiente de DeterminaçãoDeterminação

R² = 0,8119

R² = 0,81

O ajuste é BOM, porque em em 81% dos casos a variável de

demanda explica a variável de preço, sendo o restante explicado

por outra varáveis.Ex.: tipo de produto; qualidade no

serviço, etc.

b² . SXX

SYYR² =

(-1,87)² . 4.762,10 20.509,60

R² =

Page 24: Análise de Correlação e Regressão

Exercício 2

Foi feito um estudo com 40 mulheres em duas cidades e obteve-se as seguintes equações de regressão e seus

respectivos de determinação. Cidade A Cidade BY = 80,78+1,138x Y = 50,79 + 2,311xR² = 0,90 R² = 0,77

Sabe-se que a variável X indica as idades das mulheres e Y suas respectivas pressões arteriais. Com base nessas informações responda:

Page 25: Análise de Correlação e Regressão

a) Qual será a pressão arterial de uma mulher de 45 anos nas respectivas cidades?

b) Na sua opinião qual é o melhor modelo ajustado?

Justifique sua resposta! O modelo ajustado na cidade A é o que explica melhor o fenômeno pressão arterial em função da idade, pois na cidade A em 90% dos casos de pressão arterial é explicada em função da variável idade; enquanto que na cidade B em mais de 77% dos casos a variável pressão arterial é explicada em função da idade.

Cidade A Y= 80,78 + 1,138xY= 80,78 + 1,138 . 45Y= 131,99 pressão arterial

Cidade BY = 50,79 + 2,311xY = 50,79 + 2,311. 45Y = 154,78 pressão arterial

Page 26: Análise de Correlação e Regressão

De acordo com os valores acima determine:

a) Qual o valor da Correlação? Interprete esse resultado;b) Qual é a reta de regressão? Interprete esse resultado;c) Na sua opinião o modelo ajustado é bom? Justifique

sua resposta! 

Exercício 3

Page 27: Análise de Correlação e Regressão

a) r= 0,9971Interpretação: A correlação é FORTE E POSITIVA entre as variáveis de demanda e o tempo da empresa no mercado.

b) y= a+bxy= 1,1920 + 4,2954 x

É a reta de regressão quanto ao resultado podemos analisar que na abertura da empresa, ou seja, o tempo igual a 0 (zero) , a demanda inicial da empresa será de 1,2, de acordo com a variável tempo da empresa no mercado multiplicado por da 4,3 + a demanda inicial que é 1,2 , estaremos definidos a demanda atual.

Page 28: Análise de Correlação e Regressão

c) R² = 0,9943O modelo ajustado é BOM, porque em mais de 99% dos casos a variável demanda é explicada pelo tempo da empresa no mercado e o restante por outras variáveis a saber. Ex.: localidade da empresa, qualidade no serviço, tempo de produto etc.

Page 29: Análise de Correlação e Regressão

d) calcule os valores previstos para a demanda e os seus respectivos erros, usando o modelo ajustado e os valores dos tempos das empresas no mercado descritos abaixo.

ANÁLISE DOS RESÍDUOS (ERROS)

-20

-15

-10

-5

0

5

10

15

0 5 10 15 20 25

TEMPO

RE

SÍD

UO

S

RESÍDUOS

Page 30: Análise de Correlação e Regressão

TEMPO DA EMPRESA NO MERCADO

DEMANDA   RESÍDUOS ( y – y )

4 29,37 18,37 11

5 26,67 22,67 4

6 27,96 26,96 1

8 39,55 35,55 4

10 46,14 44,14 2

12 45,74 52,74 -7

15 58,62 65,62 -7

20 72,10 87,1 -15

80 346,15 344,82 5

y

( y-y ) = ry – 18,37 = 11Então:Y = y + rY = 18,37 + 11 = 29