1
ESTATÍSTICA
2
UDIII - Relação Entre Duas ou Mais Variáveis
ESTATÍSTICA
Ass 01: Regressão Simples
(2a Parte)
3
OBJETIVOS ESPECÍFICOS
• Calcular o intervalo de 95% de confiança para o coeficiente angular
• Calcular o Valor-p da hipótese nula H0: =0
4
SUMÁRIO
1. O Modelo de Regressão
2. Variabilidade Amostral
3. Intervalos de Confiança e Testes para
5
1. O Modelo de Regressão
Até aqui, nosso estudo de uma amostra de pontos envolveu apenas o ajustamento de uma reta. Queremos agora fazer inferências sobre a população subjacente, da qual se extraiu a amostra.
Para tanto, devemos construir um modelo matemático que nos permita estabelecer intervalos de confiança e testes de hipóteses.
6
a. Hipóteses Simplificadoras
1. Todas as distribuições tenham a mesma dispersão (todas as distribuições de probabilidades p(Yi/Xi) têm a mesma variância 2 para todos Xi(i=1,2,...,n)
2. As médias de todas as distribuições estão sobre uma reta, chamada reta de regressão da verdadeira população.
3. As variáveis aleatórias Yi são estatisticamente independentes.
7
8
As variáveis aleatórias Yi são estatisticamente independentes com
Média = i = + Xi
Variância = 2
Yi = + Xi + ei
Onde os ei (erro ou perturbação) são variáveis aleatórias independentes com
Média = 0
Variância = 2
9
b. A Natureza do Termo Erro
O erro aleatório pode ser considerado como a soma de duas componentes:
1. Erro de mensuração (p.ex., pesagem imprecisa).
2. A variabilidade inerente (p.ex., condições do solo, quantidade de água, etc).
10
c. Estimação de e P(Y/X)
Y= + X = a + bXYestimada por
11
2. Variabilidade Amostral
a. Distribuição Amostral de b
12
A estimativa de b tem distribuição aproximadamente normal com
Valor esperado de b =
Erro padrão de b =2x
13
3. Intervalos de Confiança e Testes para
a. Estimativa do Erro Padrão de b
Como o erro padrão de b é , onde 2 é a variância das observações Y em relação à reta populacional. Ora, 2 é, em geral, desconhecido devendo ser estimado. Uma forma natural de estimar 2 é utilizar os desvios de Y em relação à reta ajustada:
22 x/
22 )YY(n
1d
n
1
14
22 )YY(2n
1s
Estimamos, pois, 2 com a variância residual s2 definida por
Onde é o valor ajustado na reta de regressão, isto é, . Daí:
YbXaY
2x
sEP
Erro padrão
estimado:
15
b. Intervalos de Confiança
EPtb 025,0
2025,0x
stb
Intervalo de 95% de confiança para o coeficiente angular: g.l.= n-2
16
Exemplo: Determine o intervalo de 95% de confiança para o coeficiente angular relacionando a safra de trigo com o fertilizante
100200300400500600700
40505070656580
X Y42,348,254,160,065,971,877,7
059,04,36Y
-2,31,8-4,110,0-0,9-6,82,3
YY 2)YY( 5,293,24
16,81100,00,81
46,245,29
170025,0pValor
2,50113,0
059,0
EP
bt
088,0030,0
029,0059,0
)0113,0(571,2059,0
)0113,0(571,2059,0000.280
54,35571,2059,0
54,3527
68,177s2
18
PRATIQUE COM OS
EXERCÍCIOS .
BOA SORTE!
Top Related