Método dos Mínimos Quadrados - Indico IFSC (Indico) · •III – Variâncias e covariâncias;...
Transcript of Método dos Mínimos Quadrados - Indico IFSC (Indico) · •III – Variâncias e covariâncias;...
Mini curso
Método dos Mínimos Quadrados
com ênfase em covariâncias
Otaviano Helene Instituto de Física da USP
Baseado no livro Método dos Mínimos Quadrados com Formalismo Matricial e no blog
https://livrommq.blogspot.com/
Semana Integrada da Física de São Carlos
IFSC – USP Agosto 2019
Conteúdo
• I – Solução do MMQ para um problema sem solução
• II – O desvio padrão e alguns exemplos de ajustes de parâmetros
• III – Variâncias e covariâncias; propagação • IV a – Equações do MMQ com matrizes • IV b – Variâncias e covariâncias dos parâmetros
ajustados • V – Algumas propriedades do MMQ e o TCL • VI – Outros desenvolvimentos
MMQ, agosto/2019 2
Problema sem solução
m=60 m+f=65 SISTEMA INCONSISTENTE f=4
Quanto pesam criança e mãe? 3 MMQ, agosto/2019
m0 60 kg m0+f0 65 kg f0 4 kg
I – Solução do MMQ
• Procurar valores de m e f que minimizem
222 )4()65()60(),( ffmmfmQ
4 MMQ, agosto/2019
Valores de Q para diferentes valores de m e f
222 )4()65()60(),( ffmmfmQ
Mãe, m (kg)
Filho,
f (kg)
58 59 60 61 62
3,5 16,5 7,5 2,5 1,5 4,5
4,0 13,0 5,0 1,0 1,0 5,0
4,5 10,5 3,5 0,5 1,5 6,5
5,0 9,0 3,0 1,0 3,0 9,0
5,5 8,5 3,5 2,5 5,5 12,5 5 MMQ, agosto/2019
Medidas de um quadrado
• Lado = 10 cm
• Área = 120 cm2
• Perímetro = 35 cm
MMQ, agosto/2019 6
Valores evidentemente inconsistentes
Que valor adotar para o lado desse quadrado?
Q(l)= (l-10)2 + (l2-120)2 + (4l-35)2
O “melhor” valor para l é 10,9 cm
0100200300400500600700800900
1000
9 10 11 12 13
l (cm)
Q(l)
7 MMQ, agosto/2019
Solução analítica
• Quando os dados dependem linearmente dos parâmetros a serem ajustados, há uma solução analítica para os valores que minimizam Q. Exemplo
• m 60
• m+f 65
• f 4 222 )4()65()60(),( ffmmfmQ
8 MMQ, agosto/2019
222 )4()65()60(),( ffmmfmQ
0
0
~,~
~,~
fm
fm
f
Q
m
Q
0)4~
(2)65~(2
0)65~~(2)60~(2
ffm
fmm
Os valores ajustados têm um til
9 MMQ, agosto/2019
692~125
~~2
fm
fm
69
125~
~
21
12
f
m
Escrevendo na forma de matrizes
3,4
3,60
69
125
21
12~
~ 1
f
m
A menos de arredondamento, são os mesmo valores obtidos numericamente (60kg e 4,5kg)
10 MMQ, agosto/2019
• Vamos nos restringir ao caso linear.
• O caso não linear é uma aproximação, e algumas propriedades do MMQ não são válidas.
11 MMQ, agosto/2019
Exercício para resolver
MMQ, agosto/2019 12
• Determinar o rendimento (em litros por quilômetro) de um veículo
Distâncias (km) Consumo (l)
A 80 km/h A 120 km/h
200 100 29
100 200 31
500 100 49
R: 0,075 l/km a 80 km/h e 0,12 l/km a 120 km/h
Sobre o MMQ
1) O MMQ é mais geral do que se pensa. Não serve apenas para “ajustar funções” – ajusta parâmetros Os dados não precisam obedecer a distribuições normais (Verbete Método dos mínimos quadrados da Wikipédia em português está errado – jul/2019)
2) O MMQ tem limitações que nem sempre são consideradas (p. ex., nos casos em que há erro na “variável dependente” ou a relação entre dados e parâmetros não é linear).
13 MMQ, agosto/2019
II – O desvio padrão e alguns exemplos de ajustes de parâmetros
Alguns dados são mais precisos do que outros. Exemplos:
• combinar medidas com instrumentos diferentes
• medidas de uma mesma grandeza com técnicas diferentes
• medidas feitas por pessoas com habilidades diferentes
14 MMQ, agosto/2019
Aprendendo o que fazer a partir de medidas equivalentes
• x1, x2 e x3 três medidas equivalentes (mesmos procedimentos, equipamentos, experimentadores, condições externas ...).
3
321 xxxx
15 MMQ, agosto/2019
• O melhor resultado (veremos em breve o que “melhor” quer dizer) é uma média simples:
Suponha, agora, que x2 e x3 tenham sido combinados,
2
323,2
xxx
e não saibamos mais seus valores, apenas o valor médio x2,3. Como combiná-lo com x1?
Como x2,3 foi calculado usando dois dados, é razoável supor que ele tenha peso 2. Assim, a média deve ser
xxxxxx
x
33
23213,21
3,2;1
16 MMQ, agosto/2019
O peso deve refletir a precisão de um dado
• O peso é proporcional ao inverso da variância: 1/σ2.
• σ2 é a variância e σ é o desvio padrão.
• σ é uma medida de quanto um valor flutua em torno do valor verdadeiro (e desconhecido) da grandeza medida.
• Exemplo: σrégua≈0,3 mm; σpaquímetro≈0,05 mm
17 MMQ, agosto/2019
Como saber o valor do desvio padrão σ? (Vamos usar a palavra erro apenas para a
diferença entre o valor experimental e o valor verdadeiro – desconhecido, claro.)
• O fabricante de um equipamento pode informar
• Fazendo várias medidas de uma mesma grandeza
• Estudando as propriedades físicas do processo
• Conhecimento anterior
18 MMQ, agosto/2019
Estimando o d.p. I – Uma forma usual de estimar o d.p. é a partir de medidas independentes de uma mesma grandeza, p. ex., x1, x2, ... xn
n
ii xx
n 1
22
1
1
19 MMQ, agosto/2019
II – O desvio padrão da média de n dados independentes é
III – Eventos contáveis, como o número de decaimentos de uma fonte radioativa (distribuição de Poisson). Se N eventos forem observados, σ2≈N.
nmédia
20 MMQ, agosto/2019
No que segue:
• Vamos nos restringir ao caso em que os parâmetros a serem ajustados dependem linearmente dos dados.
• Vamos supor conhecidos os desvios padrões.
• Abrir mão dessas limitações têm consequências que veremos mais adiante.
21 MMQ, agosto/2019
Dois exemplos
• 1 – Consumo de combustível: gc e ge (litros/km)
distância percorrida
(km) consumo
(l) cidade estrada
100 200 28 300 100 43 400 0 49
22 MMQ, agosto/2019
a equação do MMQ
22
2
)49400()43100300(
)28200100(),(
cec
ecec
ggg
ggggQ
Derivando em relação a gc e ge, igualando a zero
99~500~500
353~500~2600
ec
ec
gg
gg
Solução:
kmlg
kmlg
e
c
/ 077,0~
/ 12,0~
23 MMQ, agosto/2019
• 2 – Ajuste dos parâmetros da função y=a·x2+b·x3 aos dados abaixo
x y -1 3,9 0 -1,6 1 1,4 3 -15
232),( iii bxaxybaQ
24 MMQ, agosto/2019
• Derivando em relação à a e igualando a zero
MMQ, agosto/2019 25
232),( iii bxaxybaQ
𝜕𝑄
𝜕𝑎= −2 𝑦𝑖 − 𝑎 𝑥𝑖
2 − 𝑏 𝑥𝑖3 𝑥𝑖
2 = 0
𝑎 𝑥𝑖2𝑥𝑖
2 + 𝑏 𝑥𝑖2𝑥𝑖
3 = 𝑦𝑖𝑥𝑖2
• Rearranjando os termos
• Derivando em relação a a e b ...
iiiiii
iiiiii
yxxxbxxa
yxxxbxxa
33323
23222
~~
~~
4,1~
6,2~
b
a
Solução
26 MMQ, agosto/2019
27 MMQ, agosto/2019
• Essa forma estranha de escrever é pelo seguinte
A função é y=a·x2+b·x3
iiiiii
iiiiii
yxxxbxxa
yxxxbxxa
33323
23222
~~
~~
iiiiii
iiiiii
yxxxbxxa
yxxxbxxa
33323
23222
~~
~~
28 MMQ, agosto/2019
Isso facilita as coisas y=a0f+b0g+c0h+..., f, g, h...são valores conhecidos e a0, b0, c0 ... parâmetros a serem ajustados.
n
i i
iiii chbgafycbaQ
12
2...
,...),,(
c
b
a
hhghf
hgggf
hfgff
yh
yg
yf
i
i
i
ii
i
ii
i
ii
i
i
i
ii
i
ii
i
ii
i
i
i
ii
i
ii
i
ii
~
~
~
2
2
22
22
2
2
222
2
2
2
2
29 MMQ, agosto/2019
• Suponha que o tempo verdadeiro a ser medido seja de t
• Suponha que haja um medidor de tempo não tendencioso que meça os valores abaixo com as probabilidades indicadas:
Um cuidado importante Tendenciosidade e não tendenciosidade
Exemplo
resultado probabilidade t-5s 25%
T 50% t+5s 25%
30 MMQ, agosto/2019
Não sabemos o valor de t, mas sabemos que, em média, o medidor fornece o valor verdadeiro t, pois o valor esperado da medida é (t-5s)×0,25+t×0,50+(t+5s)×0,25=t que é o valor verdadeiro (e desconhecido) do tempo. Note que se o tempo medido não for muito maior do que 5 s, é possível que alguns valores sejam negativos. Preserve-os No entanto, esse equipamento é tendencioso para o inverso do tempo, pois (1/(t-1s))×0,25+(1/t)×0,50+(1/(t+1s))×0,25≠1/t
31 MMQ, agosto/2019
Dez medidas não tendenciosas das massas do líquido no recipiente e do recipiente vazio.
As diferenças são os dados correspondentes ao líquido apenas
L+R (g) R (g) Diferenças (g) 2,56 1,41 1,15 1,22 2,96 -1,74 3,51 1,91 1,60 3,9 1,74 2,16
4,09 1,84 2,25 2,38 1,84 0,54 2,27 0,67 1,60 3,78 2,25 1,53 2,58 3,05 -0,47 3,99 0,76 3,23
• Outro exemplo de tendenciosidade – medida da massa de um liquido em um recipiente
32 MMQ, agosto/2019
• Se as medidas de massa são não tendenciosas, então as diferenças também não o são.
• A média das diferenças também não é tendenciosa. Essa média é 1,19 g.
• Entretanto, se os dados “não físicos” (massas negativas) fossem descartados, a média seria tendenciosa
• Os valores negativos são não físicos, mas estatisticamente necessários!
33 MMQ, agosto/2019
III – Variâncias e covariâncias
34 MMQ, agosto/2019
Já vimos a origem das variâncias e como estimá-las.
Covariância é uma espécie de variância em comum entre dois dados
Exemplo:
Massa 1= Massa líq. 1 + Massa recipiente
Massa 2= Massa líq. 2 + Massa recipiente
Representando variâncias e covariâncias
2
21
2
2
221
121
2
1
)cov()cov(
)cov()cov(
)cov()cov(
nnn
n
n
yyyy
yyyy
yyyy
YV
35 MMQ, agosto/2019
Propagação de variâncias –uma variável
Esboço de uma dedução. Se z é uma função que depende de y, z(y), expandindo z até primeira ordem em torno de y0
)()()( 00
0
yydy
dzyzyz
y
)()()()( 0000
0
yzyydy
dzyzyzz
y
então
pois <y>=y0
36 MMQ, agosto/2019
• A variância de z pode ser calculada assim:
37 MMQ, agosto/2019
2
00
20
2
yy
dy
dzzzz
2
2
0
20
2
0
2yz
dy
dzyy
dy
dz
Propagação de matrizes de covariância
• Repetindo o procedimento com mais funções e mais variáveis
z1(y1,y2,...yn), z2(y1,y2,...yn), ... zm(y1,y2,...yn),
são m funções de n variáveis:
38 MMQ, agosto/2019
tDVDV YZ
n
mmm
n
n
y
z
y
z
y
z
y
z
y
z
y
z
y
z
y
z
y
z
00201
0
2
02
2
01
2
0
1
02
1
01
1
D
39 MMQ, agosto/2019
Exemplo 1
• Lados de um retângulo: y1=105 (4), y2=48 (3)
90
016V
• Variância do perímetro, z=2(y1+y2)
2221 yzyz D
40 MMQ, agosto/2019
fazendo as contas ..
)100(2
2
90
01622
zV
o desvio padrão do perímetro é
10100 z
Perímetro é 306 (10) ou 306±10
41 MMQ, agosto/2019
Exemplo 2 • Variância da área z=y1×y2. Neste caso não
linear, a variância é aproximada
105481221 yyyzyz D
área = 5040 (368)
)136089(105
48
90
01610548
zV
42 MMQ, agosto/2019
Exemplo 3
• Perímetro e área, z1=2(y1+y2), z2=y1·y2. Variância e covariância
10548
22
2212
2111
yzyz
yzyz
D
1360893426
3426100
1052
482
90
016
10548
22V
43 MMQ, agosto/2019
• As variâncias do perímetro e da área aparecem na diagonal e a covariância entre ambas, fora da diagonal
Perímetro = 306±10 Área = 5040±368 Covariância = 3426
44 MMQ, agosto/2019
1360893426
3426100V
Exemplo importante
Ajuste dos parâmetros de uma reta y=a+bx (mais adiante, veremos como estimar a matriz de covariância dos parâmetros ajustados).
x y
-2 2,9
-1 0,2
0 0,6
1 -0,7
2 -3,6
45 MMQ, agosto/2019
0,20 0
0 0,10
Matriz de covariância dos parâmetros a, b ajustados
Variâncias em interpolações yint=aaj+bajx
)10,020,0(1
10,00
020,01)( 22 x
xxy
46 MMQ, agosto/2019
Incertezas nas interpolações e extrapolações
47 MMQ, agosto/2019
• Covariâncias entre valores interpolados ou extrapolados:
t
b
a
b
a
yyx
x
x
x
ba
1
1
10,00
020,0
1
1V
2
2
10,020,010,020,0
10,020,010,020,0
bba
baayy
xxx
xxxba
V
Valores interpolados ou extrapolados são covariantes; são correlacionados uns com os outros. Isso é importante.
48 MMQ, agosto/2019
Relevância da correlação entre valores interpolados: cálculo da incerteza de Δy=ya-yb
]10,02)(10,0[
1
1
10,020,010,020,0
10,020,010,020,011)(
22
2
22
baba
bba
baay
xxxx
xxx
xxx
Se xa=xb, evidentemente a incerteza em Δy será nula, como esperado.
49 MMQ, agosto/2019
Fontes de covariância
• Cálculos a partir de valores ajustados
• Medidas com um mesmo equipamento (a incerteza do equipamento afetará todos os dados igualmente). Ex: régua, aceleradores
Não confundir covariância com erro sistemático
50 MMQ, agosto/2019
IV a – Equações do MMQ com matrizes
• As equações do MMQ escritas de forma matricial são mais simples do que na forma tradicional. Como isso só ficará totalmente claro daqui a pouco, peço alguma paciência.
51 MMQ, agosto/2019
Estebelecimento do problema a) Peso mãe e criança
m0 60 kg m0+f0 65 kg f0 4 kg
m=60
m+f=65 SISTEMA INCONSISTENTE, POIS HÁ ERROS
f=4
52 MMQ, agosto/2019
m0, f0 valores verdadeiros (e desconhecidos) das massas da mãe e do filho
e1 etc. erros de medida. Essas equações podem ser escritas como
30
200
10
4
65
60
efkg
efmkg
emkg
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
53 MMQ, agosto/2019
• Atenção: erro= diferença entre valor verdadeiro e valor experimental.
• Não confundir erro com desvio padrão
• Erro é desconhecido (desvio padrão é conhecido)
54 MMQ, agosto/2019
b) Parâmetros de uma reta
x1 y1
x2 y2
x3 y3 xbay 00
33003
22002
11001
exbay
exbay
exbay
3
2
1
0
0
3
2
1
3
2
1
1
1
1
e
e
e
b
a
x
x
x
y
y
y
55 MMQ, agosto/2019
y a x a x a x e
y a x a x a x e
y a x a x a x e
m m
m m
n n n m nm n
1 01 11 02 12 0 1 1
2 01 21 02 22 0 2 2
01 1 02 2 0
...
...
...
nmnmnn
m
m
n e
e
e
a
a
a
xxx
xxx
xxx
y
y
y
2
1
0
02
01
21
22221
11211
2
1
Notem: as equações são lineares nos parâmetros (m0, f0, a0, b0).
56 MMQ, agosto/2019
c) Caso geral
nmnmnn
m
m
n e
e
e
a
a
a
xxx
xxx
xxx
y
y
y
2
1
0
02
01
21
22221
11211
2
1
eAXY 0
Escr
eve
nd
o o
pro
ble
ma
57 MMQ, agosto/2019
eAXY 0
O que precisamos minimizar:
V é a matriz de covariância dos dados Quando não há covariância entre os dados, essa expressão se reduz à
n
i i
iiii chbgafycbaQ
12
2...
,...),,(
A)X(YVA)X(YA t 1)(Q
58 MMQ, agosto/2019
Derivando Q(A) em relação a cada um dos parâmetros e igualando a zero obtemos o valor ajustado,
YVXX)V(XA 1t11t ~
Estimativa dos parâmetros pelo MMQ
Vamos chamar o valor ajustado de Ã. Ele é dado por
, ...m , ja
Q
j
21 , 0
59 MMQ, agosto/2019
Exemplo 1: pesos, mãe e filho
• Para continuar o problema, vamos supor que todos os desvios padrões sejam iguais a 1 (V=matriz identidade de ordem n=3) e não haja covariância entre os dados
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
60 MMQ, agosto/2019
10
11
01
X
YVXX)V(XA 1t11t ~
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
3,4
3,60~A
Evidentemente, o mesmo resultado que havíamos obtido
usando o procedimento tradicional
4
65
60
Y
100
010
001
V
61 MMQ, agosto/2019
y1=a0+box1+e1
y2=a0+box2+e2
y3=a0+box3+e3
y4=a0+box4+e4
y5=a0+box5+e5
Exemplo 2: parâmetros de uma reta
x y
-2 1,8
-1 0,4
0 -4,2
2 -7,5
5 -10,8
y=a0+box
51
21
01
11
21
X
8,10
5,7
2,4
4,0
8,1
Y
10000
01000
00100
00010
00001
V
62 MMQ, agosto/2019
YVXX)V(XA 1t11t ~
85,1
57,2Ã
63 MMQ, agosto/2019
a) y1 e y2 com mesmos desvios padrões σ:
• y1= yo+ e1
• y2= yo+ e2
Exemplo 3: média de dois dados
1
1X
YVXX)V(XA 1t11t ~
2
2
0
0
V
2
1
y
yY oy0A
eAXY 0
2
~ 21 yyy
64 MMQ, agosto/2019
b) y1 e y2 com desvios padrões diferentes:
• y1= yo+ e1
• y2= yo+ e2
1
1X
YVXX)V(XA 1t11t ~
2
1
y
yY oy0A
eAXY 0
22
21
222
211
11
~
yyy
65 MMQ, agosto/2019
IV b – Variâncias e covariâncias dos parâmetros ajustados
YVXX)V(XA 1t11t ~
Como à depende de Y, sua matriz de covariância depende da matriz de
covariância de Y. Vamos calcular isso por propagação.
66 MMQ, agosto/2019
• Portanto,
YVXX)V(XA 1t11t ~
1t11t
AVXX)V(XD
n
mmm
n
n
y
A
y
A
y
A
y
A
y
A
y
A
y
A
y
A
y
A
21
2
2
2
1
2
1
2
1
1
1
~
11t
AAAX)V(XDVDV
t~~~
67 MMQ, agosto/2019
11t
AX)V(XV
~
YVXX)V(XA 1t11t ~
68 MMQ, agosto/2019
tDVDV YZ
11t
AX)V(XV
~
YVXX)V(XA 1t11t ~
eAXY 0
Quatro equações básicas
69 MMQ, agosto/2019
Exemplo 1: pesos, mãe e filho
Vamos supor que todos os desvios padrões sejam iguais a 1 e não haja covariância entre os dados
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
1
V
100
010
001
10
11
01
X
70 MMQ, agosto/2019
11t
AX)V(XV
~
67,033,0
33,067,0~A
V
3,4
3,60~A
m 60,3±0,8 kg f 4,3±0,8 kg Covariância (m,f)= - 0,33
71 MMQ, agosto/2019
Exemplo 2: Consumo de combustível: gc e ge (litros/km)
distância percorrida (km)
consumo (l)
cidade estrada 100 200 28 300 100 43 400 0 49
72 MMQ, agosto/2019
Vamos supor que V seja
uma matriz identidade,
e
e
c
g
g
0400
100300
200100
49
43
28
1
V
100
010
001
YVXX)V(XA 1t11t ~
4~ 10
248,0048,0
048,0048,0
077,0
12,0~
AV
A
11t
AX)V(XV
~
73 MMQ, agosto/2019
Consumo em quilômetros/litro?
yc=1/gc=8,27km/l , ye=1/ge=13,0km/l
ty DVDV
2
2
10
01
e
c
e
e
c
e
e
c
c
c
g
g
g
y
g
y
g
y
g
y
D
0.703 0.055-
0.055- 0.022yV
yc=(8,27±0,15) km/l ye=(13,0±0,15) km/l
74 MMQ, agosto/2019
Vale a pena insistir: resumo
Em nenhum momento foi feita qualquer hipótese quanto a forma da função densidade de probabilidade
dos dados.
YVXX)V(XA 1t11t ~ 11t
AX)V(XV
~
eAXY 0 Relação linear entre dados e parâmetros
A matriz de covariância dos dados deve ser conhecida (os erros são desconhecidos)
75 MMQ, agosto/2019
V – Algumas propriedades do MMQ e o TCL
(a) Não tendenciosidade
Espera-se que se y é uma medida de uma grandeza (um dado, uma média, o resultado de um ajuste...), seu valor esperado seja igual ao valor verdadeiro da grandeza,
0yy
76 MMQ, agosto/2019
resultado probabilidade 1,8 s 25% 2,0 s 50% 2,2 s 25%
• O MMQ é não tendencioso quando os dados também são não tendenciosos
Se yi representa os dados e <yi>=y0i, como yi=y0i+ei , onde ei é o erro, então <ei>=0.
YVXX)V(XA 1t11t ~
77 MMQ, agosto/2019
Vamos ver como fica o valor esperado de parâmetros ajustados pelo MMQ:
O valor esperado de à é
eAXY 0
YVXX)V(XA1t11t ~
Como os dados se relacionam com os parâmetros na forma
00 AXeAXY
então
78 MMQ, agosto/2019
portanto,
01t11t
1t11t
AXVXX)V(X
YVXX)V(XA
~
0AA ~
Conclusão: se os dados não são tendenciosos, os parâmetros ajustados pelo MMQ também
não serão tendenciosos
79 MMQ, agosto/2019
(b) Mínima variância
• Entre todas as estimativas não tendenciosas de parâmetros que dependem linearmente dos dados, o MMQ fornece aquelas com menor variância
2
21 xxx
2/22 x
80 MMQ, agosto/2019
• Exemplo: dois dados com mesmo desvio padrão σ e não covariantes. O resultado do MMQ é
Outra estimativa geral, linear nos dados e não tendenciosa:
21 )1( xaaxx
Qual valor de a leva à menor variância dessa estimativa? Por propagação de incerteza,
x a a2 2 2 21( ( ) )
81 MMQ, agosto/2019
• Derivando em relação à a e igualando a zero, obtemos a=1/2 e, portanto,
2
21 xxx
que é o resultado do MMQ:
82 MMQ, agosto/2019
(c) O Teorema Central do Limite
Exemplo: médias de dados uniformemente distribuídos entre zero e um.
0
2
4
6
8
10
a
83 MMQ, agosto/2019
Um só dado
O valor ajustado obedece a uma distribuição normal quando ele é resultado de muitos dados
• Média de dois, quatro e oito dados
0
2
4
6
8
10
12
b
0
5
10
15
20
d
0
5
10
15
c
84 MMQ, agosto/2019
• O TCL garante que
xx x xn n
n
1 12
2 22 2
12
22 21 1 1
tende uma gaussiana com desvio padrão igual a 1, quaisquer que sejam as f.d.p.s dos dados
85 MMQ, agosto/2019
O TCL no contexto do MMQ
à é uma média dos vários dados experimentais yi, com pesos inversamente às respectivas variâncias
YVXX)V(XA 1t11t ~
86 MMQ, agosto/2019
Desde que a quantidade de dados seja suficientemente grande, cada parâmetro deverá obedecer a uma distribuição
normal, independente da forma da f. d. p. de cada dado
Exemplo
y=a+bx, onde os diferentes valores yi obedecem a diferentes f.d.p.s
x y d.p. Tipo
-3 5,0 1,0 gaussiana
-2 3,5 0,3 uniforme
-1 2,3 0,7 tipo qui2
0 1,1 1,0 gaussiana
1 -0,6 0,5 binomial
2 -0,2 0,4 duas uniformes
3 -2,8 0,5 binomial
87 MMQ, agosto/2019
Parâmetros a e b ajustados: 1,20(18); -1,14(9) devem obedecer a uma f,d,p, gaussiana ou bem perto disso,
Seria exatamente gaussiana se a quantidade de dados fosse infinita
88 MMQ, agosto/2019
Ilustração com muitas simulações Valores ajustados de a e b
89 MMQ, agosto/2019
• a) Medida de uma grandeza altera valores de outras
• b) Como incorporar um dado perdido
• c) Vínculos entre parâmetros
• d) Média de dados correlacionados
VI – Outros desenvolvimentos
90 MMQ, agosto/2019
• As próximas transparências discutem esses problemas
MMQ, agosto/2019 91
• Exemplo: a e b foram medidos, obtendo-se os valores 10,0 e 20,0, com matriz de covariância
a) Medida de uma grandeza altera outras
108
810V
Uma medida independente de b forneceu o valor 25,0 com variância igual a 10. Vamos ao MMQ.
92 MMQ, agosto/2019
• Evidentemente, valor adotado para b foi alterado; seu d. p., idem.
• Menos evidente: o valor adotado para a é alterado e seu d.p., idem.
1000
0108
0810
V
25
20
10
Y
3
2
1
0
0
10
10
01
25
20
10
e
e
e
b
a
5,22
0,12 YVX'X)V(X'Ã
111
0,50,4
0,48,6V
93 MMQ, agosto/2019
b) Como incorporar um novo dado a um ajuste
Parâmetros a e b foram ajustados
94 MMQ, agosto/2019
𝑦 = 𝑎 + 𝑏𝑥
𝑨 =𝑎 𝑏
𝑽𝑨 =𝜎𝑎2 𝜌. 𝜎𝑎 . 𝜎𝑏
𝜌. 𝜎𝑎 . 𝜎𝑏 𝜎𝑏2
𝑥, 𝑦, 𝜎
𝑎 𝑏
𝑦 =
1 00 11 𝑥
∙𝑎0𝑏0
+
𝜀1𝜀2𝜀3
𝑽𝒂, 𝒃 ,𝒚 =
𝜎𝑎2 𝜌. 𝜎𝑎 . 𝜎𝑏 0
𝜌. 𝜎𝑎 . 𝜎𝑏 𝜎𝑏2 0
0 0 𝜎2
Novo dado é obtido
c) Vínculos entre parâmetros
• Exemplo: mede-se os três ângulos internos de um triângulo, digamos, 1, 2, e 3, sendo os resultados y1,σ1; y2, σ2; y3, σ3. Mas queremos impor a condição .
• Um procedimento geral é ajustar valores para os parâmetros, 1, 2 e 3, impondo o vínculo.
o180~~~
321
95 MMQ, agosto/2019
• Uma forma geral de escrever vínculo lineares:
g a rij j
j
m
i
1
onde aj são os parâmetros a serem ajustados e gij e ri são valores conhecidos.
No caso do triangulo só há um vínculo (r=180o) e todos os gs são iguais a 1.
96 MMQ, agosto/2019
A equações de vínculo podem ser escritas como
GA R
Solução do MMQ:
~~A V X V Y BC RA
t 1 1
V H BC BA~ 1 1 t
B H G 1 t C GH G 1 tH X V X t 1
97 MMQ, agosto/2019
Exemplo
Ângulos de um triângulo: 48o, 41o, 94º (soma=183o) todos com σ=1 e não covariantes. G=[1 1 1] e R=[180].
1 0 0
0 1 0
0 0 1
V
94
41
48
Y
98 MMQ, agosto/2019
Resultado: Valores ajustados: 47o, 40o, 93o . Soma é 180o: obedece vínculo. As variâncias diminuem
1 0 0
0 1 0
0 0 1
V
0,67 0,33- 0,33-
0,33- 0,67 0,33-
0,33- 0,33- 0,67
V
Vela a pena impor vínculos? Depende. Incertezas diminuem, mas surgem correlações.
P. ex., se o que queremos é apenas um dos ângulos, sim.
99 MMQ, agosto/2019
Breve resumo
• O MMQ deve ser usado: – Sempre que as incertezas dos dados sejam
conhecidas (ou todas sejam iguais)
–Há uma relação linear entre os dados e os parâmetros a serem ajustados
100 MMQ, agosto/2019
d)Média de dados correlacionados
Considere uma situação na qual temos n dados correspondentes à uma mesma grandeza, y1, y2, ... yn.
Para simplificar, vamos supor que todos tenham o mesmo desvio padrão 𝜎.
Método dos Mínimos Quadrados 101
Caso os dados fossem não correlacionados, o valor a ser adotado seria a média simples dos dados e o desvio padrão dessa média seria 𝜎 𝑛
Suponha, entretanto, que a matriz de covariância dos dados seja
Método dos Mínimos Quadrados 102
𝐕 = 𝜎2
1 𝜌 ⋯ 𝜌𝜌 1 ⋱ ⋮
𝜌 𝜌 ⋯⋮1
Todas as variâncias são iguais a σ2.
Todas as covariâncias todas iguais a ρ·σ2.
O problema pode ser colocado dentro do esquema do MMQ, com y y e
y y e
y y en n
1 0 1
2 0 2
0
1
1
1
X
~yn
yi
i
n
1
1
~y
n
n
221
Método dos Mínimos Quadrados 103
Os resultados para o valor adotado e a variância são
~yn
yi
i
n
1
1
Método dos Mínimos Quadrados 104
Como no caso de dados não correlacionados, o valor adotado é a média simples dos dados
Resultado esperado, pois todas as variâncias e covariâncias são iguais e, portanto, nenhum dado poderia ter peso maior que os demais.
~y
n
n
221
Método dos Mínimos Quadrados 105
A variância depende da correlação
Note que se ρ=0, a variância desse valor é 𝜎 𝑛 , como esperado, e tende a zero quando n tende a infinito
Se ρ não é nulo, entretanto, mesmo que n tenda a infinito, ρ·σ2. Conclusão: a covariância é um limite para a variância do valor adotado
• O ajuste é não tendencioso • Os dados não precisam obedecer a nenhum
f.d.p. particular • Se há uma quantidade grande de dados, as
f.d.p.s dos parâmetros ajustados tendem a formas gaussianas
• Não precisa haver uma relação funcional do tipo y=y(x) para usar o MMQ
• As covariâncias são tão importantes quanto as variâncias
106 MMQ, agosto/2019