Material de TesteF
-
Upload
luan-sousa -
Category
Documents
-
view
215 -
download
0
description
Transcript of Material de TesteF
Material de Apoio:
Teste F/ANOVA/Correlação e
Regressão
Teste F
Teste F
Objetivo:
Testar uma afirmativa sobre dois desvios-
padrão ou variâncias populacionais.
Teste F
Condições:
1. As duas populações independentes.
2. Amostras Aleatórias Simples
3. Ambas oriundas de Distribuição Normal
Teste F
Condições:
��� = variânciadapopulaçãodaqualseextraiu
aamostracomamaiorvariância
�� = tamanhodaamostracomamaiorvariância
��� = maiordasduasvariânciasamostrais
F =s�
�
s��
Teste F
Teste F
Exemplo
Teste a afirmativa, para � = 0,05 e supondo que as
distribuições são normalmente distribuídas, de que
os pesos de bebês nascidos de mães que recebem
placebos variam mais do que pesos de bebês
nascidos de mães que recebem um suplemento de
zinco.
Placebo zinco
"̅ 3088 g 3214 g
� 728 g 669 g
n 16 16
Tabela F-Snedecor
Distribuição F (α=0,05)
GL1 (15)
GL2 (15) 2,4034
Exemplo
$% =728�
669�= 1,1842
$-%,�-,�- = 2,4034
Exemplo
Conclusão:
Considerando que o resultado encontrado para oteste de estatística F, igual a 1,1842, está fora daárea de rejeição correspondida por valoresmaiores do que 2,4034, com a confiança de 95%,pode-se concluir que não há evidência suficientepara apoiar a afirmativa de que o peso de bebêsnascidos de mães que receberam placebo variamais do que o peso de bebês nascidos de mãesque receberam os suplementos de zinco.
ANOVA
Exemplo
Ho: µ1= µ2= µ3 ....
H1: pelo menos uma das médias é diferente uma das outras
Valor de P <= α� Rejeita H0
Se pelo menos uma das médias populacionais for diferente
Teste de Bonferroni
*mais informações no capítulo 13
Correlação
Definição
Há correlação entre duas variáveis
quando os valores de uma variável
estão relacionados, de alguma
maneira, com os valores da outra
variável
Exemplos
Perímetro de um quadrado e o tamanho do lado do quadrado
Exemplos
A quantidade de oxigênio em um rio e a temperatura da água.
Exemplos
A quantidade de defeitos produzidos por uma injetora e o tempo de
operação da máquina.
Tipos de Correlação
x
y
Correlação linear negativa
x
y
Sem correlação
x
y
Correlação linear positiva
x
y
Correlação não linear
Conforme x
aumenta, y tende
a decrescer.
Conforme x
aumenta, y
tende a
aumentar.
Formas de Quantificar
Covariância
Indicador que fornece o grau e o
sinal da correlação entre 2 variáveis
012 = 345 ", 6 =∑ ("9 − ")(69 −<
9=� 6)
� − 1
Coeficiente de Correlação Linear
(Pearson) - r
Mede a força da correlação linear
entre valores quantitativos
emparelhados de x e y de uma
amostra
1 2
Coeficiente de Correlação Linear
(Pearson) - r
1 2
>? = ∑1@A1 B
<A�
<9=� >C = ∑
2@A2 B
<A�
<9=�
Coeficiente de Correlação Linear
(Pearson) - r
A amplitude do coeficiente de correlação é -1 para 1
-1 0 1
Se r = -1 existe
uma correlação
negativa perfeita.
Se r = 1 Existe
uma correlação
positiva perfeita.
Se r está próximo
de 0 não existe
correlação linear.
Correlação Linear (Pearson)
Correlação negativa forte
Correlação positiva fraca
Correlação positiva forte
Correlação não linear
x
y
x
y
x
y
x
y
r = −0,91 r = 0,88
r = 0,42 r = 0,07
Exemplo
Calcule o coeficiente de
correlação para os dados
dos gastos com
propaganda e vendas da
empresa informados no
tabela ao lado. O que
podemos concluir, existe
correlação entre eles?
Gastos
com
Propagan
da
($1000)
Vendas
da
Empresa
($1000)
2,4 225
1,6 184
2,0 220
2,6 240
1,4 180
1,6 184
2,0 186
2,2 215
Exemplo
Nenhuma correlação
CorrelaçãoCorrelação
Exemplo
Conclusão:
Considerando que o resultado encontrado para o
coeficiente de correlação é igual a 0,913, existe
uma correlação linear positiva forte. Conforme
aumenta o gasto com propaganda, as vendas da
empresa também aumentam.
Teste de Hipótese
Teste do coeficiente de correlação
O valor de r (amostra) é uma
estimativa do verdadeiro coeficiente da
população (ρ).
Para fazer o teste de hipótese, para α,
de correlação linear nula, deve-se
supor H0: ρ=0.
D = E<A�
�AFBGH = � − 2
Teste do coeficiente de correlação
Pelo exemplo anterior, para verificar a
correlação linear (5%):
H0: ρ=0
H1: ρ≠0
D = 0,9138 − 2
1 − 0,913�= 5,482
D�,-%,I = 2,447
Regressão
Objetivo
Determinar uma função que
exprima o relacionamento entre
duas variáveis
Regressão Linear Simples
A linha de regressão é uma reta, e
é simples por se tratar de apenas
2 variáveis (x e y).
x
y
Metodologia
Após verificar se a correlação linear
entre duas variáveis é significante,
o próximo passo é determinar a
equação da linha que melhor
modela os dados (linha de
tendência).
Metodologia
J �
" = 5KELá5NOPENQLD4EK4RL�QNPN�QN�DN
6 = 5KELá5NOEN�P4�DK4RQNPN�QN�DN
S� =E�2
�1
SJ = 6T − S�"̅
Metodologia
" = 5KELá5NOPENQLD4EK4RL�QNPN�QN�DN
6 = 5KELá5NOEN�P4�DK4RQNPN�QN�DN
U =E�2
�1
V = 6T − S�"̅
Exemplo
Voltando ao exemplo referente aos
gastos com propaganda, expresse a
linha de tendência para os dados.
Exemplo
Voltando ao exemplo referente aos
gastos com propaganda, expresse a
linha de tendência para os dados.
Exemplo
y = 50,729x + 104,06
R² = 0,8334
0
50
100
150
200
250
300
1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8
Predição
Se a empresa investir $3200 em
propaganda, qual é o retorno em
vendas esperado?
Exemplo
Considere que a variável
independente agora faz referencia
aos dados de vendas para
empresa, qual é a equação de reta
nesse caso?
Exemplo
Coeficiente de determinação - �
• Indica a qualidade da regressão
•Está relacionada ao coeficiente de
Pearson
Coeficiente de determinação - �
•Se o R² de um modelo é 0,8334,
isto significa que 83,34% da
variável dependente consegue ser
explicada pelos regressores
presentes no modelo.
Coeficiente de determinação - �
Em geral, com −0,7 < E < 0,7, não se
deve cogitar de se estabelecer a reta
de mínimos quadrados, pois E� =
0,49 , significando que a reta de
regressão não consegue explicar nem a
metade da variação de Y
Resíduos
Definição
Para um par de valores amostrais x e y,
o resíduo é a diferença entre o valor
amostral observado de y e o valor que
é predito pelo uso da equação de
regressão.
EN�íQR4 = 6YZ[%F\]^Y − 6_F%\9[`Y
6F = 6 − 6a
Resíduos
Exercício
Exercício
No começo de um determinado mês, ascotações de uma empresa na Bolsa de valoresapresentam-se como no quadro que segue.Considerado um modelo linear, qual a melhorestimativa para o sétimo dia? Pode-se concluir,ao nível de significância de 5%, que essa açãoesteja num período de baixa? Elabore umgráfico de resíduos.
Dia 1 2 3 4 5
Valor da ação 3,8 3,4 3,1 2,4 2,0