Regressão

18
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Professor Mauricio Lutz 1 REGRESSÃO LINEAR SIMPLES A correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. O gráfico cartesiano que representa essa linha é denominado diagrama de dispersão. Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da reta; essa reta é chamada de reta de regressão e a equação que a representa é a equação de regressão. O diagrama de dispersão é construído de acordo com os dados amostrais de n observações e a equação de regressão é dada pela expressão: b aX Y + = , onde a e b são os parâmetros. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ( ) ( ) ( ) å å å å å - - = 2 2 i i i i i i x x n y x x y x n a e x a y b - = , Onde: n é o número de observações; x é a média dos valores i x ÷ ÷ ø ö ç ç è æ = å n x x i ; y é a média dos valores i y ÷ ÷ ø ö ç ç è æ = å n y y i . Obs.: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo assim escrevemos: b aX Y + = ^ , onde o ^ Y é o Y estimado. Exemplos: a) Determinar a reta de regressão linear, sabendo que existe uma forte correlação entre o peso total do lixo descartado, por dia, numa empresa com o peso do papel contido nesse lixo. Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10 Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14 Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43

description

Estatistica

Transcript of Regressão

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    1

    REGRESSO LINEAR SIMPLES

    A correlao linear uma correlao entre duas variveis, cujo grfico

    aproxima-se de uma linha. O grfico cartesiano que representa essa linha

    denominado diagrama de disperso. Para poder avaliar melhor a correlao entre

    as variveis, interessante obter a equao da reta; essa reta chamada de reta

    de regresso e a equao que a representa a equao de regresso. O diagrama

    de disperso construdo de acordo com os dados amostrais de n observaes e a

    equao de regresso dada pela expresso:

    baXY += , onde a e b so os parmetros.

    Vamos, ento, calcular os valores dos parmetros a e b com a ajuda

    das formulas:

    ( ) ( )( )

    -

    -=

    22ii

    iiii

    xxn

    yxxyxna e xayb -= ,

    Onde:

    n o nmero de observaes;

    x a mdia dos valores ix

    =

    n

    xx i ;

    y a mdia dos valores iy

    =

    n

    yy i .

    Obs.: Como estamos fazendo uso de uma amostra para obtermos os valores dos

    parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de

    regresso. Sendo assim escrevemos:

    baXY +=^

    , onde o ^

    Y o Y estimado.

    Exemplos: a) Determinar a reta de regresso linear, sabendo que existe uma forte

    correlao entre o peso total do lixo descartado, por dia, numa empresa com o

    peso do papel contido nesse lixo.

    Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10

    Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14

    Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    2

    De acordo com os dados, fazemos a representao grfica. Os pares

    ordenados formam o diagrama de disperso.

    Para facilitar o clculo construmos a seguinte tabela:

    Peso total ( ix ) Peso do papel ( iy ) ii yx . 2ix

    H1 10,47 2,43 25,44 109,62

    H2 19,85 5,12 101,63 394,02

    H3 21,25 6,88 146,20 451,56

    H4 24,36 6,22 151,52 593,41

    H5 27,38 8,84 242,04 749,66

    H6 28,09 8,76 246,07 789,05

    H7 33,61 7,54 253,42 1129,63

    H8 35,73 8,47 302,63 1276,63

    H9 38,33 9,55 366,05 1469,19

    H10 49,14 11,43 561,67 2414,74

    288,21 75,24 2396,68 9377,52 Temos assim:

    ( ) ( )( )

    2131,02,10710

    88,2281830652,93775

    92,216848,23966

    )21,288(52,93771024,7521,28868,239610

    222

    ==-

    -=

    --

    =-

    -=

    a

    xxx

    xxn

    yxxyxna

    ii

    iiii

    Como 524,710

    24,75==y e 821,28

    1021,288

    ==x vem:

    3835,11405,6524,7821,282131,0524,7 =-=-=-= xxayb

    Logo:

    38,121,0^

    += XY

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    3

    Com base no conhecimento da equao da reta, pode-se interpolar e

    extrapolar valores.

    Interpolao: a interpolao ocorre quando o valor considerado

    pertence ao intervalo da tabela, porm, no figura entre os dados coletados.

    Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se

    estimar o peso de papel contido nesse lixo. Uma vez que 15 kg no um dado

    coletado e, conseqentemente, no pertence tabela de dados, utiliza-se a

    equao da reta para determinar o valor correspondente ao peso do papel.

    Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel

    contido nesse lixo.

    Extrapolao: a extrapolao ocorre quando o valor considerado no

    pertence ao intervalo da tabela, e tambm no figura entre os dados coletados.

    Suponha que o peso do lixo descartado seja de 60 kg. Esse valor no

    um dado coletado e nem se encontra dentro do intervalo [10,47, 49,14]. Essa

    situao semelhante anterior e utiliza-se a equao de reta para determinar o

    peso do papel.

    Para 60 kg de lixo descartado, estima-se, por extrapolao, que haja

    14,16 kg de papel contido nesse lixo.

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    4

    b) Consideremos uma amostra aleatria, formada por dez dos 98 alunos de uma

    classe da faculdade A e pelas notas obtidas por eles em matemtica e estatstica:

    Nmeros Notas

    Matemtica ( ix ) Estatstica ( iy )

    01 5,0 6,0

    08 8,0 9,0

    24 7,0 8,0

    38 10,0 10,0

    44 6,0 5,0

    58 7,0 7,0

    59 9,0 8,0

    72 3,0 4,0

    80 8,0 6,0

    92 2,0 2,0

    Vamos verificar a correlao primeiro fazendo um diagrama de

    disperso:

    Correlao entre as notas de matemtica e estatstica

    Nmeros Notas

    ii yx . 2ix

    Matemtica ( ix ) Estatstica ( iy )

    01 5,0 6,0 30 25

    08 8,0 9,0 72 64

    24 7,0 8,0 56 49

    38 10,0 10,0 100 100

    44 6,0 5,0 30 36

    58 7,0 7,0 49 49

    59 9,0 8,0 72 81

    72 3,0 4,0 12 9

    80 8,0 6,0 48 64

    92 2,0 2,0 4 4

    65 65 473 481

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    5

    Temos assim:

    ( ) ( )( )

    8632,0585505

    4225481042254730

    )65(48110656547310

    222==

    --

    =--

    =-

    -=

    xxx

    xxn

    yxxyxna

    ii

    iiii

    Como 5,61065

    ==y e 5,61065

    ==x vem:

    8892,06108,55,65,68632,05,6 =-=-=-= xxayb

    Logo: 89,086,0^

    += XY

    Para traarmos a reta no grfico, basta determinar dois de seus pontos:

    89,00^

    == YX

    19,589,0586,05^

    =+== xYX

    Assim temos:

    Coeficiente de determinao

    Trata-se de um indicador da qualidade do ajustamento.

    Dessa maneira, o coeficiente de determinao ou coeficiente de

    explicao dado por 2R, onde 10

    2 R , ou se multiplicarmos (100) = % temos

    %1000 2 R O coeficiente de determinao (R2) igual ao quadrado do coeficiente

    de correlao linear de Pearson (r). O R2 expressa a proporo da variao total

    que explicada (divida) reta de regresso de x sobre y.

    Utilizando os valores do exemplo anterior de correlao temos:

    %02,83

    8302,0)9112,0(2

    22

    =

    ==

    R

    R

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    6

    Interpretamos esse resultado da seguinte maneira: o uso da varivel

    nota em matemtica, X , explica 83,02% das notas em estatstica Y.

    Exerccios

    1)Complete o esquema para o ajustamento de uma reta aos dados:

    ix 2 4 6 8 10 12 14

    iy 30 25 22 18 15 11 10

    Temos:

    ix iy ii yx . 2ix

    4 30 60 4

    ........ ........ ........ ........

    ........ ........ ........ ........

    ........ ........ ........ ........

    ........ ........ ........ ........

    ........ ........ ........ ........

    14 10 140 196

    ........= ........= ........= ........=

    Logo: ( )................................(........)........

    ........................

    ................

    ................(........)................

    ........)(................)(........2

    =+=-=

    ==--

    =-

    -=

    b

    xxx

    a

    Donde:

    ........=a e ........=b

    Isto : ................^

    +-= XY

    2) A tabela abaixo apresenta valores que mostram como o comprimento de uma

    barra de ao varia conforme a temperatura:

    Temperatura (C) 10 15 20 25 30

    Comprimento (mm) 1.003 1.005 1.010 1.011 1.014

    Determine:

    a) O coeficiente de correlao;

    b) A reta ajustada a essa correlao;

    c) O coeficiente de determinao.

    d) O valor estimado do comprimento da barra para a temperatura de 18C;

    e) O valor estimado do comprimento da barra para a temperatura de 35C.

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    7

    3) A variao do valor do BTN (Bnus do Tesouro Nacional), relativamente a

    alguns meses de 1990, deu origem tabela:

    Meses Abr. Mai. Jun. Jul. Ago. Set. Out. Nov.

    Valores (Cr$) 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76 a) Calcule o grau de correlao.

    b) Estabelea a equao de regresso de Y sobre X.

    c) Calcule o coeficiente de determinao.

    d) Estime o valor do BTN para o ms de dezembro.

    Sugesto: Substitua os meses, respectivamente, por 1, 2, ..., 8.

    4) A partir da tabela:

    ix 1 2 3 4 5 6

    iy 70 50 40 30 20 10

    a) Calcule o coeficiente de correlao;

    b) Determine a reta ajustada;

    c) Calcule o coeficiente de determinao;

    d) Estime Y para X=0.

    5) Certa empresa, estudando a variao de demanda de seu produto em relao a

    variao de preo de venda, obteve a tabela:

    Preo ( ix ) 38 42 50 56 59 63 70 80 95 110

    Demanda ( iy ) 350 325 297 270 256 246 238 223 215 208

    a) Determine o coeficiente de correlao;

    b) Estabelea a equao da reta ajustada; c) Calcule o coeficiente de determinao;

    c) Estime Y para X=60 e X=120.

    6) Pretendendo-se estudar a relao entre as variveis consumo de energia

    eltrica ( ix ) e volume de produo nas empresas industriais ( iy ), fez-se uma

    amostragem que inclui vinte empresas, computando-se os seguintes valores:

    = 34,11ix ; = 70,20iy ; = 16,122ix ; = 96,842iy e = 13,22ii yx . Determine:

    a) O calculo do coeficiente de correlao;

    b) A equao de regresso de Y para X;

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    8

    c) A equao de regresso de X para Y.

    7) Vamos supor que exista uma relao linear entre as variveis: X = despesas em

    propaganda e Y = vendas de certo produto.

    Considerando os dados abaixo:

    X 1,5 5,5 10,0 3,0 7,5 5,0 13,0 4,0 9,0 12,5 15,0

    Y 120 190 240 140 180 150 280 110 210 220 310

    Determine:

    a) Faa o diagrama de disperso.

    b) Calcule o coeficiente de correlao de Pearson.

    c) Estabelea a equao da reta ajustada.

    d) Calcular o valor de vendas para um gasto com propaganda de 4,5.

    e) Calcule o coeficiente de determinao e interprete-o.

    8) Para uma empresa manter-se competitiva, gastos de pesquisa e

    desenvolvimento (P & D) so essenciais. Para determinar o nvel timo de

    gastos em P & D e seu efeito sobre o valor da empresa, foi aplicada anlise de

    regresso linear simples, onde:

    Y = razo entre preos e ganhos e X = razo entre gastos com P & D e vendas.

    Os dados das 20 empresas usadas no estudo so os seguintes:

    Empresas Y X Empresas Y X Empresas Y X Empresas Y X

    1 5,6 0,003 6 8,2 0,030 11 8,4 0,058 16 11,5 0,083

    2 7,2 0,004 7 6,3 0,035 12 11,1 0,058 17 9,8 0,091

    3 8,1 0,009 8 10,0 0,037 13 11,1 0,067 18 16,1 0,092

    4 9,9 0,021 9 8,5 0,044 14 13,2 0,080 19 7,0 0,064

    5 6,0 0,023 10 13,2 0,051 15 13,4 0,080 20 5,9 0,028

    a) Construir o diagrama de disperso.

    b) Calcule o coeficiente de correlao de Pearson.

    c) Estabelecer a equao da reta ajustada.

    d) Usar a equao obtida pra prever o valor de Y, quando X = $0,070.

    e) Calcule o coeficiente de determinao.

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    9

    Resoluo dos exerccios:

    1)Complete o esquema para o ajustamento de uma reta aos dados:

    ix 2 4 6 8 10 12 14

    iy 30 25 22 18 15 11 10

    Temos:

    ix iy ii yx . 2ix

    2 30 60 4

    3 25 75 9

    6 22 132 36

    8 18 144 64

    10 15 150 100

    12 11 132 144

    14 10 140 196

    55= 131= 833= 553= Logo:

    ( )4752,3176089,127143,188578,7)6241,1(7143,18

    6241,18461374

    3025387172055831

    )55(.5537)13155()8337(

    2

    =+=--=

    -=-

    =--

    =-

    -=

    b

    xxx

    a

    Donde:

    6241,1-=a e 4752,31=b

    Isto : 4752,316241,1^

    +-= XY

    2) A tabela abaixo apresenta valores que mostram como o comprimento de uma

    barra de ao varia conforme a temperatura:

    Temperatura (C) 10 15 20 25 30

    Comprimento (mm) 1.003 1.005 1.010 1.011 1.014

    Determine:

    a) O coeficiente de correlao;

    b) A reta ajustada a essa correlao;

    c) O coeficiente de determinao.

    d) O valor estimado do comprimento da barra para a temperatura de 18C;

    e) O valor estimado do comprimento da barra para a temperatura de 35C.

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    10

    ix iy ii yx . 2ix

    2iy

    10 1003 10030 100 1006009

    15 1005 15075 225 1010025

    20 1010 20200 400 1020100

    25 1011 25275 625 1022121

    30 1014 30420 900 1028196

    100= 5043= 101000= 2250= 5086451=

    a)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]9826,0

    3903,712700

    4061250

    700

    25431849254322551000011250

    )504300()505000(

    50435086451510022505

    )5043100()1010005(

    .

    .222222

    ===--

    -=

    --

    -=

    --

    -=

    xxr

    xxx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    b)

    ( )4,9972,116,1008201217,06,1008

    56,01250700

    1000011250504300505000

    )100(22505)5043100()1010005(

    2

    =-=-=

    ==--

    =--

    =

    xb

    xxx

    a

    Isto : 4,99756,0^

    += XY

    c) %55,96

    9655,0)9826,0(2

    22

    =

    ==

    R

    R

    d) mmxY 48,10074,9971856,0^

    =+=

    e) mmxY 10174,9973556,0^

    =+=

    3) A variao do valor do BTN (Bnus do Tesouro Nacional), relativamente a

    alguns meses de 1990, deu origem tabela:

    Meses Abr. Mai. Jun. Jul. Ago. Set. Out. Nov.

    Valores (Cr$) 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76

    a) Calcule o grau de correlao.

    b) Estabelea a equao de regresso de Y sobre X.

    c) Calcule o coeficiente de determinao.

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    11

    d) Estime o valor do BTN para o ms de dezembro.

    Sugesto: Substitua os meses, respectivamente, por 1, 2, ..., 8.

    ix iy ii yx . 2ix

    2iy

    1 41,73 41,73 1 1741,393

    2 41,73 83,46 4 1741,393

    3 43,98 131,94 9 1934,24

    4 48,91 195,64 16 2392,188

    5 53,41 267,05 25 2852,628

    6 59,06 354,36 36 3488,084

    7 66,65 466,55 49 4442,223

    8 75,76 606,08 64 5739,578

    36= 23,431= 81,2146= 204= 73,24331= a)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]9655,0

    196,17092,1650

    496,8694336

    2,1650

    3,1859598,19465312961632

    )28,15524()48,17174(

    23,43173,243318362048

    )23,43136()81,21468(

    .

    .222222

    ===--

    -=

    --

    -=

    --

    -=

    xxr

    xxx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    b) ( )8029,311009,229038,535,49113,49038,53

    9113,4336

    2,165012961632

    28,1552448,17174)36(2048

    )23,43136()81,21468(2

    =-=-=

    ==--

    =--

    =

    xb

    xxx

    a

    Isto : 8029,319113,4^

    += XY

    c) %22,93

    9322,0)9655,0(2

    22

    =

    ==

    R

    R

    d) Dezembro igual a x=9

    0046,768029,3199113,4^

    =+= xY

    O valor para dezembro de Cr$ 76,0046

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    12

    4) A partir da tabela:

    ix 1 2 3 4 5 6

    iy 70 50 40 30 20 10

    a) Calcule o coeficiente de correlao;

    b) Determine a reta ajustada;

    c) Calcule o coeficiente de determinao;

    d) Estime Y para X=0

    ix iy ii yx . 2ix

    2iy

    1 70 70 1 4900

    2 50 100 4 2500

    3 40 120 9 1600

    4 30 120 16 900

    5 20 100 25 400

    6 10 60 36 100

    21= 220= 570= 91= 10400= a)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]9897,0

    436,12121200

    14000105

    1200

    4840062400441546

    )4620()3420(

    22010400621916

    )22021()5706(

    .

    .222222

    =-

    =-

    =--

    -=

    --

    -=

    --

    -=

    xxr

    xxx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    b) ( )6667,76406667,36)5,34286,11(6667,36

    4286,111051200

    44154646203420

    )21(916)22021()5706(

    2

    =+=--=

    -=-

    =--

    =--

    =

    xb

    xxx

    a

    Isto : 6667,764286,11^

    +-= XY

    c) %96,97

    9796,0)9897,0(2

    22

    =

    =-=

    R

    R

    d) Para X=0 temos:

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    13

    667,766667,7604286,11^

    =+-= xY

    5) Certa empresa, estudando a variao de demanda de seu produto em relao a

    variao de preo de venda, obteve a tabela:

    Preo ( ix ) 38 42 50 56 59 63 70 80 95 110

    Demanda ( iy ) 350 325 297 270 256 246 238 223 215 208

    a) Determine o coeficiente de correlao;

    b) Estabelea a equao da reta ajustada;

    c) Calcule o coeficiente de determinao;

    c) Estime Y para X=60 e X=120.

    ix iy ii yx . 2ix

    2iy

    38 350 13300 1444 122500

    42 325 13650 1764 105625

    50 297 14850 2500 88209

    56 270 15120 3136 72900

    59 256 15104 3481 65536

    63 246 15498 3969 60516

    70 238 16660 4900 56644

    80 223 17840 6400 49729

    95 215 20425 9025 46225

    110 208 22880 12100 43264

    663= 2628= 165327= 48719= 711148= a)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]9015,0

    5090,9882789094

    20509647621

    89094

    69063847111480439569487190

    )1742364()1653270(

    2628711148106634871910

    )2628663()16532710(

    .

    .222222

    -=-

    =-

    =--

    -=

    --

    -=

    --

    -=

    xxr

    xxx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    b) ( )8405,3860405,1248,262)3,668709,1(8,262

    8709,14762189094

    43956948719017423641653270

    )663(4871910)2628663()16532710(

    2

    =+=--=

    -=-

    =--

    =-

    -=

    xb

    xxx

    a

    Isto : 8405,3868709,1^

    +-= XY

    c) %27,81

    8127,0)9015,0(2

    22

    =

    =-=

    R

    R

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    14

    d) Para X=60 temos:

    5867,2748405,386608709,1^

    =+-= xY Para X=120 temos:

    3328,1628405,3861208709,1^

    =+-= xY

    6) Pretendendo-se estudar a relao entre as variveis consumo de energia

    eltrica ( ix ) e volume de produo nas empresas industriais ( iy ), fez-se uma

    amostragem que inclui vinte empresas, computando-se os seguintes valores:

    = 34,11ix ; = 70,20iy ; = 16,122ix ; = 96,842iy e = 13,22ii yx . Determine:

    a) O calculo do coeficiente de correlao;

    b) A equao de regresso de Y para X;

    c) A equao de regresso de X para Y.

    a)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]5447.0

    6136,381862,207

    71,12706044,114

    862,207

    49,4282,16995956,1282,243

    )738,234()6,442(

    70,2096,842034,1116,1220

    )70,2034,11()13,2220(

    .

    .222222

    ===--

    -=

    --

    -=

    --

    -=

    xxr

    xxx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    b) ( )0066,00284,1035,1)567,08137,1(035,1

    8137,16040,114862,207

    5956,1282,243738,2346,442

    )34,11(16,1220)70,2034,11()13,2220(

    2

    =-=-=

    ==--

    =-

    -=

    xb

    xxx

    a

    Isto : 0066,08137,1^

    +-= XY

    c) = 34,11iy ; = 70,20ix ; = 16,122iy ; = 96,842ix e = 13,22ii yx .

    ( )3977,01693,0567,0)035,11636,0(567,0

    1636,071,1270

    862,20749,4282,1699

    738,2346,442)70,20(96,8420

    )70,2034,11()13,2220(2

    =-=-=

    ==--

    =-

    -=

    xb

    xxx

    a

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    15

    Isto : 3977,01636,0^

    += YX

    7) Vamos supor que exista uma relao linear entre as variveis: X = despesas em

    propaganda e Y = vendas de certo produto.

    Considerando os dados abaixo:

    X 1,5 5,5 10,0 3,0 7,5 5,0 13,0 4,0 9,0 12,5 15,0

    Y 120 190 240 140 180 150 280 110 210 220 310

    Determine:

    a) Faa o diagrama de disperso.

    b) Calcule o coeficiente de correlao de Pearson.

    c) Estabelea a equao da reta ajustada.

    d) Calcular o valor de vendas para um gasto com propaganda de 4,5.

    e) Calcule o coeficiente de determinao e interprete-o.

    a)

    ix iy ii yx . 2ix

    2iy

    1,5 120 180 2,25 14400

    5,5 190 1045 30,25 36100

    10,0 240 2400 100 57600

    3,0 140 420 9 19600

    7,5 180 1350 56,25 32400

    5,0 150 750 25 22500

    13,0 280 3640 169 78400

    4,0 110 440 16 12100

    9,0 210 1890 81 44100

    12,5 220 2750 156,25 48400

    15,0 310 4650 225 96100

    86= 2150= 19515= 870= 461700=

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    16

    b)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]9451,0

    52,3149229765

    4562002174

    29765

    4622500507870073969570

    )184900()214665(

    2150461700118687011

    )215086()1951511(

    .

    .222222

    ===--

    -=

    --

    -=

    --

    -=

    xxr

    xxx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    c) ( )4131,880415,1074545,195

    6914,13217429765

    73969570184900214665

    )86(87011)215086()1951511(

    2

    =-=

    ==--

    =--

    =

    b

    xxx

    a

    Isto : 4131,886914,13^

    += XY

    d) Quando X=4,5 temos:

    0241,1504131,885,46914,134131,886914,13^

    =+=+= xXY

    e) %32,89

    8932,0)9451,0(2

    22

    =

    ==

    R

    R

    89,3% das vendas explicada pela propaganda, os outros 10,7%

    devido a outros fatores.

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    17

    8) Para uma empresa manter-se competitiva, gastos de pesquisa e

    desenvolvimento (P & D) so essenciais. Para determinar o nvel timo de gastos

    em P & D e seu efeito sobre o valor da empresa, foi aplicada anlise de regresso

    linear simples, onde:

    Y = razo entre preos e ganhos e X = razo entre gastos com P & D e vendas.

    Os dados das 20 empresas usadas no estudo so os seguintes:

    Empresas Y X Empresas Y X Empresas Y X Empresas Y X 1 5,6 0,003 6 8,2 0,030 11 8,4 0,058 16 11,5 0,083 2 7,2 0,004 7 6,3 0,035 12 11,1 0,058 17 9,8 0,091 3 8,1 0,009 8 10,0 0,037 13 11,1 0,067 18 16,1 0,092 4 9,9 0,021 9 8,5 0,044 14 13,2 0,080 19 7,0 0,064 5 6,0 0,023 10 13,2 0,051 15 13,4 0,080 20 5,9 0,028

    a) Construir o diagrama de disperso.

    b) Calcule o coeficiente de correlao de Pearson.

    c) Estabelecer a equao da reta ajustada.

    d) Usar a equao obtida pra prever o valor de Y, quando X = $0,070.

    e) Calcule o coeficiente de determinao.

    a)

    ix iy ii yx . 2ix

    2iy

    0,003 5,6 0,0168 0,000009 31,36

    0,004 7,2 0,0288 0,000016 51,84

    0,009 8,1 0,0729 0,000081 65,61

    0,021 9,9 0,2079 0,000441 98,01

    0,023 6,0 0,1380 0,000529 36

    0,030 8,2 0,2460 0,000900 67,24

    0,035 6,3 0,2205 0,001225 39,69

    0,037 10,0 0,3700 0,001369 100

    0,044 8,5 0,3740 0,001936 72,25

    0,051 13,2 0,6732 0,002601 174,24

    0,058 8,4 0,4872 0,003364 70,56

    0,058 11,1 0,6438 0,003364 123,21

    0,067 11,1 0,7437 0,004489 123,21

    0,080 13,2 1,0560 0,006400 174,24

    0,080 13,4 1,0720 0,006400 179,56

    0,083 11,5 0,9545 0,006889 132,25

    0,091 9,8 0,8918 0,008281 96,04

    0,092 16,1 1,4812 0,008464 259,21

    0,064 7,0 0,4480 0,004096 49

    0,028 5,9 0,1652 0,000784 34,81

    958,0= 5,190= 2915,10= 061638,0= 33,1978=

  • Instituto Federal farroupilha Campus Alegrete RS 377 km 27 Passo Novo

    Alegrete - RS Fone/Fax: (55) 3421-9600

    www.al.iffarroupilha.edu.br

    Professor Mauricio Lutz

    18

    b)

    ( )( )( )[ ] ( )[ ] ( )[ ] ( )[ ]

    [ ] [ ]7262,0

    12533,32331,23

    25,3276314996,0

    331,23

    25,362906,39566917764,023276,1

    )499,182()83,205(

    5,19033,201978958,0061638,020

    )5,190958,0()2915,1020(

    .

    .222222

    ===--

    -=

    --

    -=

    --

    -=

    xxr

    xx

    xx

    yynxxn

    yxyxnr

    iiii

    iiii

    c) ( )9772,5547838,3526,90479,00676,74526,9

    0676,74314996,0

    331,23917764,023276,1

    499,18283,205)958,0(061638,020

    )5,190958,0()2915,1020(2

    =-=-=

    ==--

    =-

    -=

    xb

    xxx

    a

    Isto : 9772,50676,74^

    += XY

    d) Quando X = $0,070 temos:

    1619,119772,51847,59772,5070,00676,749772,50676,74^

    =+=+=+= xXY

    e) %74,52

    5274,0)7262,0(2

    22

    =

    ==

    R

    R