Método dos Mínimos Quadrados - Indico IFSC (Indico) · •III – Variâncias e covariâncias;...

Mini curso

Método dos Mínimos Quadrados

com ênfase em covariâncias

Otaviano Helene Instituto de Física da USP

Baseado no livro Método dos Mínimos Quadrados com Formalismo Matricial e no blog

https://livrommq.blogspot.com/

Semana Integrada da Física de São Carlos

IFSC – USP Agosto 2019

https://livrommq.blogspot.com/

Conteúdo

• I – Solução do MMQ para um problema sem solução

• II – O desvio padrão e alguns exemplos de ajustes de parâmetros

• III – Variâncias e covariâncias; propagação • IV a – Equações do MMQ com matrizes • IV b – Variâncias e covariâncias dos parâmetros

ajustados • V – Algumas propriedades do MMQ e o TCL • VI – Outros desenvolvimentos

MMQ, agosto/2019 2

Problema sem solução

m=60 m+f=65 SISTEMA INCONSISTENTE f=4

Quanto pesam criança e mãe? 3 MMQ, agosto/2019

m0 60 kg m0+f0 65 kg f0 4 kg

I – Solução do MMQ

• Procurar valores de m e f que minimizem

222 )4()65()60(),( ffmmfmQ

4 MMQ, agosto/2019

Valores de Q para diferentes valores de m e f

222 )4()65()60(),( ffmmfmQ

Mãe, m (kg)

Filho,

f (kg)

58 59 60 61 62

3,5 16,5 7,5 2,5 1,5 4,5

4,0 13,0 5,0 1,0 1,0 5,0

4,5 10,5 3,5 0,5 1,5 6,5

5,0 9,0 3,0 1,0 3,0 9,0

5,5 8,5 3,5 2,5 5,5 12,5 5 MMQ, agosto/2019

Medidas de um quadrado

• Lado = 10 cm

• Área = 120 cm2

• Perímetro = 35 cm

MMQ, agosto/2019 6

Valores evidentemente inconsistentes

Que valor adotar para o lado desse quadrado?

Q(l)= (l-10)2 + (l2-120)2 + (4l-35)2

O “melhor” valor para l é 10,9 cm

0100200300400500600700800900

1000

9 10 11 12 13

l (cm)

Q(l)

7 MMQ, agosto/2019

Solução analítica

• Quando os dados dependem linearmente dos parâmetros a serem ajustados, há uma solução analítica para os valores que minimizam Q. Exemplo

• m 60

• m+f 65

• f 4 222 )4()65()60(),( ffmmfmQ

8 MMQ, agosto/2019

222 )4()65()60(),( ffmmfmQ

0

0

~,~

~,~

fm

fm

f

Q

m

Q

0)4~

(2)65~(2

0)65~~(2)60~(2

ffm

fmm

Os valores ajustados têm um til

9 MMQ, agosto/2019

692~125

~~2

fm

fm

69

125~

~

21

12

f

m

Escrevendo na forma de matrizes

3,4

3,60

69

125

21

12~

~ 1

f

m

A menos de arredondamento, são os mesmo valores obtidos numericamente (60kg e 4,5kg)

10 MMQ, agosto/2019

• Vamos nos restringir ao caso linear.

• O caso não linear é uma aproximação, e algumas propriedades do MMQ não são válidas.

11 MMQ, agosto/2019

Exercício para resolver

MMQ, agosto/2019 12

• Determinar o rendimento (em litros por quilômetro) de um veículo

Distâncias (km) Consumo (l)

A 80 km/h A 120 km/h

200 100 29

100 200 31

500 100 49

R: 0,075 l/km a 80 km/h e 0,12 l/km a 120 km/h

Sobre o MMQ

1) O MMQ é mais geral do que se pensa. Não serve apenas para “ajustar funções” – ajusta parâmetros Os dados não precisam obedecer a distribuições normais (Verbete Método dos mínimos quadrados da Wikipédia em português está errado – jul/2019)

2) O MMQ tem limitações que nem sempre são consideradas (p. ex., nos casos em que há erro na “variável dependente” ou a relação entre dados e parâmetros não é linear).

13 MMQ, agosto/2019

II – O desvio padrão e alguns exemplos de ajustes de parâmetros

Alguns dados são mais precisos do que outros. Exemplos:

• combinar medidas com instrumentos diferentes

• medidas de uma mesma grandeza com técnicas diferentes

• medidas feitas por pessoas com habilidades diferentes

14 MMQ, agosto/2019

Aprendendo o que fazer a partir de medidas equivalentes

• x1, x2 e x3 três medidas equivalentes (mesmos procedimentos, equipamentos, experimentadores, condições externas ...).

3

321 xxxx

15 MMQ, agosto/2019

• O melhor resultado (veremos em breve o que “melhor” quer dizer) é uma média simples:

Suponha, agora, que x2 e x3 tenham sido combinados,

2

323,2

xxx

e não saibamos mais seus valores, apenas o valor médio x2,3. Como combiná-lo com x1?

Como x2,3 foi calculado usando dois dados, é razoável supor que ele tenha peso 2. Assim, a média deve ser

xxxxxx

x

33

23213,21

3,2;1

16 MMQ, agosto/2019

O peso deve refletir a precisão de um dado

• O peso é proporcional ao inverso da variância: 1/σ2.

• σ2 é a variância e σ é o desvio padrão.

• σ é uma medida de quanto um valor flutua em torno do valor verdadeiro (e desconhecido) da grandeza medida.

• Exemplo: σrégua≈0,3 mm; σpaquímetro≈0,05 mm

17 MMQ, agosto/2019

Como saber o valor do desvio padrão σ? (Vamos usar a palavra erro apenas para a

diferença entre o valor experimental e o valor verdadeiro – desconhecido, claro.)

• O fabricante de um equipamento pode informar

• Fazendo várias medidas de uma mesma grandeza

• Estudando as propriedades físicas do processo

• Conhecimento anterior

18 MMQ, agosto/2019

Estimando o d.p. I – Uma forma usual de estimar o d.p. é a partir de medidas independentes de uma mesma grandeza, p. ex., x1, x2, ... xn

n

ii xx

n 1

22

1

1

19 MMQ, agosto/2019

II – O desvio padrão da média de n dados independentes é

III – Eventos contáveis, como o número de decaimentos de uma fonte radioativa (distribuição de Poisson). Se N eventos forem observados, σ2≈N.

nmédia

20 MMQ, agosto/2019

No que segue:

• Vamos nos restringir ao caso em que os parâmetros a serem ajustados dependem linearmente dos dados.

• Vamos supor conhecidos os desvios padrões.

• Abrir mão dessas limitações têm consequências que veremos mais adiante.

21 MMQ, agosto/2019

Dois exemplos

• 1 – Consumo de combustível: gc e ge (litros/km)

distância percorrida

(km) consumo

(l) cidade estrada

100 200 28 300 100 43 400 0 49

22 MMQ, agosto/2019

a equação do MMQ

22

2

)49400()43100300(

)28200100(),(

cec

ecec

ggg

ggggQ

Derivando em relação a gc e ge, igualando a zero

99~500~500

353~500~2600

ec

ec

gg

gg

Solução:

kmlg

kmlg

e

c

/ 077,0~

/ 12,0~

23 MMQ, agosto/2019

• 2 – Ajuste dos parâmetros da função y=a·x2+b·x3 aos dados abaixo

x y -1 3,9 0 -1,6 1 1,4 3 -15

232),( iii bxaxybaQ

24 MMQ, agosto/2019

• Derivando em relação à a e igualando a zero

MMQ, agosto/2019 25

232),( iii bxaxybaQ

𝜕𝑄

𝜕𝑎= −2 𝑦𝑖 − 𝑎 𝑥𝑖

2 − 𝑏 𝑥𝑖3 𝑥𝑖

2 = 0

𝑎 𝑥𝑖2𝑥𝑖

2 + 𝑏 𝑥𝑖2𝑥𝑖

3 = 𝑦𝑖𝑥𝑖2

• Rearranjando os termos

• Derivando em relação a a e b ...

iiiiii

iiiiii

yxxxbxxa

yxxxbxxa

33323

23222

~~

~~

4,1~

6,2~

b

a

Solução

26 MMQ, agosto/2019

27 MMQ, agosto/2019

• Essa forma estranha de escrever é pelo seguinte

A função é y=a·x2+b·x3

iiiiii

iiiiii

yxxxbxxa

yxxxbxxa

33323

23222

~~

~~

iiiiii

iiiiii

yxxxbxxa

yxxxbxxa

33323

23222

~~

~~

28 MMQ, agosto/2019

Isso facilita as coisas y=a0f+b0g+c0h+..., f, g, h...são valores conhecidos e a0, b0, c0 ... parâmetros a serem ajustados.

n

i i

iiii chbgafycbaQ

12

2...

,...),,(

c

b

a

hhghf

hgggf

hfgff

yh

yg

yf

i

i

i

ii

i

ii

i

ii

i

i

i

ii

i

ii

i

ii

i

i

i

ii

i

ii

i

ii

~

~

~

2

2

22

22

2

2

222

2

2

2

2

29 MMQ, agosto/2019

• Suponha que o tempo verdadeiro a ser medido seja de t

• Suponha que haja um medidor de tempo não tendencioso que meça os valores abaixo com as probabilidades indicadas:

Um cuidado importante Tendenciosidade e não tendenciosidade

Exemplo

resultado probabilidade t-5s 25%

T 50% t+5s 25%

30 MMQ, agosto/2019

Não sabemos o valor de t, mas sabemos que, em média, o medidor fornece o valor verdadeiro t, pois o valor esperado da medida é (t-5s)×0,25+t×0,50+(t+5s)×0,25=t que é o valor verdadeiro (e desconhecido) do tempo. Note que se o tempo medido não for muito maior do que 5 s, é possível que alguns valores sejam negativos. Preserve-os No entanto, esse equipamento é tendencioso para o inverso do tempo, pois (1/(t-1s))×0,25+(1/t)×0,50+(1/(t+1s))×0,25≠1/t

31 MMQ, agosto/2019

Dez medidas não tendenciosas das massas do líquido no recipiente e do recipiente vazio.

As diferenças são os dados correspondentes ao líquido apenas

L+R (g) R (g) Diferenças (g) 2,56 1,41 1,15 1,22 2,96 -1,74 3,51 1,91 1,60 3,9 1,74 2,16

4,09 1,84 2,25 2,38 1,84 0,54 2,27 0,67 1,60 3,78 2,25 1,53 2,58 3,05 -0,47 3,99 0,76 3,23

• Outro exemplo de tendenciosidade – medida da massa de um liquido em um recipiente

32 MMQ, agosto/2019

• Se as medidas de massa são não tendenciosas, então as diferenças também não o são.

• A média das diferenças também não é tendenciosa. Essa média é 1,19 g.

• Entretanto, se os dados “não físicos” (massas negativas) fossem descartados, a média seria tendenciosa

• Os valores negativos são não físicos, mas estatisticamente necessários!

33 MMQ, agosto/2019

III – Variâncias e covariâncias

34 MMQ, agosto/2019

Já vimos a origem das variâncias e como estimá-las.

Covariância é uma espécie de variância em comum entre dois dados

Exemplo:

Massa 1= Massa líq. 1 + Massa recipiente

Massa 2= Massa líq. 2 + Massa recipiente

Representando variâncias e covariâncias

2

21

2

2

221

121

2

1

)cov()cov(

)cov()cov(

)cov()cov(

nnn

n

n

yyyy

yyyy

yyyy

YV

35 MMQ, agosto/2019

Propagação de variâncias –uma variável

Esboço de uma dedução. Se z é uma função que depende de y, z(y), expandindo z até primeira ordem em torno de y0

)()()( 00

0

yydy

dzyzyz

y

)()()()( 0000

0

yzyydy

dzyzyzz

y

então

pois <y>=y0

36 MMQ, agosto/2019

• A variância de z pode ser calculada assim:

37 MMQ, agosto/2019

2

00

20

2

yy

dy

dzzzz

2

2

0

20

2

0

2yz

dy

dzyy

dy

dz

Propagação de matrizes de covariância

• Repetindo o procedimento com mais funções e mais variáveis

z1(y1,y2,...yn), z2(y1,y2,...yn), ... zm(y1,y2,...yn),

são m funções de n variáveis:

38 MMQ, agosto/2019

tDVDV YZ

n

mmm

n

n

y

z

y

z

y

z

y

z

y

z

y

z

y

z

y

z

y

z

00201

0

2

02

2

01

2

0

1

02

1

01

1

D

39 MMQ, agosto/2019

Exemplo 1

• Lados de um retângulo: y1=105 (4), y2=48 (3)

90

016V

• Variância do perímetro, z=2(y1+y2)

2221 yzyz D

40 MMQ, agosto/2019

fazendo as contas ..

)100(2

2

90

01622

zV

o desvio padrão do perímetro é

10100 z

Perímetro é 306 (10) ou 306±10

41 MMQ, agosto/2019

Exemplo 2 • Variância da área z=y1×y2. Neste caso não

linear, a variância é aproximada

105481221 yyyzyz D

área = 5040 (368)

)136089(105

48

90

01610548

zV

42 MMQ, agosto/2019

Exemplo 3

• Perímetro e área, z1=2(y1+y2), z2=y1·y2. Variância e covariância

10548

22

2212

2111

yzyz

yzyz

D

1360893426

3426100

1052

482

90

016

10548

22V

43 MMQ, agosto/2019

• As variâncias do perímetro e da área aparecem na diagonal e a covariância entre ambas, fora da diagonal

Perímetro = 306±10 Área = 5040±368 Covariância = 3426

44 MMQ, agosto/2019

1360893426

3426100V

Exemplo importante

Ajuste dos parâmetros de uma reta y=a+bx (mais adiante, veremos como estimar a matriz de covariância dos parâmetros ajustados).

x y

-2 2,9

-1 0,2

0 0,6

1 -0,7

2 -3,6

45 MMQ, agosto/2019

0,20 0

0 0,10

Matriz de covariância dos parâmetros a, b ajustados

Variâncias em interpolações yint=aaj+bajx

)10,020,0(1

10,00

020,01)( 22 x

xxy

46 MMQ, agosto/2019

Incertezas nas interpolações e extrapolações

47 MMQ, agosto/2019

• Covariâncias entre valores interpolados ou extrapolados:

t

b

a

b

a

yyx

x

x

x

ba

1

1

10,00

020,0

1

1V

2

2

10,020,010,020,0

10,020,010,020,0

bba

baayy

xxx

xxxba

V

Valores interpolados ou extrapolados são covariantes; são correlacionados uns com os outros. Isso é importante.

48 MMQ, agosto/2019

Relevância da correlação entre valores interpolados: cálculo da incerteza de Δy=ya-yb

]10,02)(10,0[

1

1

10,020,010,020,0

10,020,010,020,011)(

22

2

22

baba

bba

baay

xxxx

xxx

xxx

Se xa=xb, evidentemente a incerteza em Δy será nula, como esperado.

49 MMQ, agosto/2019

Fontes de covariância

• Cálculos a partir de valores ajustados

• Medidas com um mesmo equipamento (a incerteza do equipamento afetará todos os dados igualmente). Ex: régua, aceleradores

Não confundir covariância com erro sistemático

50 MMQ, agosto/2019

IV a – Equações do MMQ com matrizes

• As equações do MMQ escritas de forma matricial são mais simples do que na forma tradicional. Como isso só ficará totalmente claro daqui a pouco, peço alguma paciência.

51 MMQ, agosto/2019

Estebelecimento do problema a) Peso mãe e criança

m0 60 kg m0+f0 65 kg f0 4 kg

m=60

m+f=65 SISTEMA INCONSISTENTE, POIS HÁ ERROS

f=4

52 MMQ, agosto/2019

m0, f0 valores verdadeiros (e desconhecidos) das massas da mãe e do filho

e1 etc. erros de medida. Essas equações podem ser escritas como

30

200

10

4

65

60

efkg

efmkg

emkg

3

2

1

0

0

10

11

01

4

65

60

e

e

e

f

m

53 MMQ, agosto/2019

• Atenção: erro= diferença entre valor verdadeiro e valor experimental.

• Não confundir erro com desvio padrão

• Erro é desconhecido (desvio padrão é conhecido)

54 MMQ, agosto/2019

b) Parâmetros de uma reta

x1 y1

x2 y2

x3 y3 xbay 00

33003

22002

11001

exbay

exbay

exbay

3

2

1

0

0

3

2

1

3

2

1

1

1

1

e

e

e

b

a

x

x

x

y

y

y

55 MMQ, agosto/2019

y a x a x a x e

y a x a x a x e

y a x a x a x e

m m

m m

n n n m nm n

1 01 11 02 12 0 1 1

2 01 21 02 22 0 2 2

01 1 02 2 0

...

...

...

nmnmnn

m

m

n e

e

e

a

a

a

xxx

xxx

xxx

y

y

y

2

1

0

02

01

21

22221

11211

2

1

Notem: as equações são lineares nos parâmetros (m0, f0, a0, b0).

56 MMQ, agosto/2019

c) Caso geral

nmnmnn

m

m

n e

e

e

a

a

a

xxx

xxx

xxx

y

y

y

2

1

0

02

01

21

22221

11211

2

1

eAXY 0

Escr

eve

nd

o o

pro

ble

ma

57 MMQ, agosto/2019

eAXY 0

O que precisamos minimizar:

V é a matriz de covariância dos dados Quando não há covariância entre os dados, essa expressão se reduz à

n

i i

iiii chbgafycbaQ

12

2...

,...),,(

A)X(YVA)X(YA t 1)(Q

58 MMQ, agosto/2019

Derivando Q(A) em relação a cada um dos parâmetros e igualando a zero obtemos o valor ajustado,

YVXX)V(XA 1t11t ~

Estimativa dos parâmetros pelo MMQ

Vamos chamar o valor ajustado de Ã. Ele é dado por

, ...m , ja

Q

j

21 , 0

59 MMQ, agosto/2019

Exemplo 1: pesos, mãe e filho

• Para continuar o problema, vamos supor que todos os desvios padrões sejam iguais a 1 (V=matriz identidade de ordem n=3) e não haja covariância entre os dados

3

2

1

0

0

10

11

01

4

65

60

e

e

e

f

m

60 MMQ, agosto/2019

10

11

01

X

YVXX)V(XA 1t11t ~

3

2

1

0

0

10

11

01

4

65

60

e

e

e

f

m

3,4

3,60~A

Evidentemente, o mesmo resultado que havíamos obtido

usando o procedimento tradicional

4

65

60

Y

100

010

001

V

61 MMQ, agosto/2019

y1=a0+box1+e1

y2=a0+box2+e2

y3=a0+box3+e3

y4=a0+box4+e4

y5=a0+box5+e5

Exemplo 2: parâmetros de uma reta

x y

-2 1,8

-1 0,4

0 -4,2

2 -7,5

5 -10,8

y=a0+box

51

21

01

11

21

X

8,10

5,7

2,4

4,0

8,1

Y

10000

01000

00100

00010

00001

V

62 MMQ, agosto/2019

YVXX)V(XA 1t11t ~

85,1

57,2Ã

63 MMQ, agosto/2019

a) y1 e y2 com mesmos desvios padrões σ:

• y1= yo+ e1

• y2= yo+ e2

Exemplo 3: média de dois dados

1

1X

YVXX)V(XA 1t11t ~

2

2

0

0

V

2

1

y

yY oy0A

eAXY 0

2

~ 21 yyy

64 MMQ, agosto/2019

b) y1 e y2 com desvios padrões diferentes:

• y1= yo+ e1

• y2= yo+ e2

1

1X

YVXX)V(XA 1t11t ~

2

1

y

yY oy0A

eAXY 0

22

21

222

211

11

~

yyy

65 MMQ, agosto/2019

IV b – Variâncias e covariâncias dos parâmetros ajustados

YVXX)V(XA 1t11t ~

Como Ã depende de Y, sua matriz de covariância depende da matriz de

covariância de Y. Vamos calcular isso por propagação.

66 MMQ, agosto/2019

• Portanto,

YVXX)V(XA 1t11t ~

1t11t

AVXX)V(XD

n

mmm

n

n

y

A

y

A

y

A

y

A

y

A

y

A

y

A

y

A

y

A

21

2

2

2

1

2

1

2

1

1

1

~

11t

AAAX)V(XDVDV

t~~~

67 MMQ, agosto/2019

11t

AX)V(XV

~

YVXX)V(XA 1t11t ~

68 MMQ, agosto/2019

tDVDV YZ

11t

AX)V(XV

~

YVXX)V(XA 1t11t ~

eAXY 0

Quatro equações básicas

69 MMQ, agosto/2019

Exemplo 1: pesos, mãe e filho

Vamos supor que todos os desvios padrões sejam iguais a 1 e não haja covariância entre os dados

3

2

1

0

0

10

11

01

4

65

60

e

e

e

f

m

1

V

100

010

001

10

11

01

X

70 MMQ, agosto/2019

11t

AX)V(XV

~

67,033,0

33,067,0~A

V

3,4

3,60~A

m 60,3±0,8 kg f 4,3±0,8 kg Covariância (m,f)= - 0,33

71 MMQ, agosto/2019

Exemplo 2: Consumo de combustível: gc e ge (litros/km)

distância percorrida (km)

consumo (l)

cidade estrada 100 200 28 300 100 43 400 0 49

72 MMQ, agosto/2019

Vamos supor que V seja

uma matriz identidade,

e

e

c

g

g

0400

100300

200100

49

43

28

1

V

100

010

001

YVXX)V(XA 1t11t ~

4~ 10

248,0048,0

048,0048,0

077,0

12,0~

AV

A

11t

AX)V(XV

~

73 MMQ, agosto/2019

Consumo em quilômetros/litro?

yc=1/gc=8,27km/l , ye=1/ge=13,0km/l

ty DVDV

2

2

10

01

e

c

e

e

c

e

e

c

c

c

g

g

g

y

g

y

g

y

g

y

D

0.703 0.055-

0.055- 0.022yV

yc=(8,27±0,15) km/l ye=(13,0±0,15) km/l

74 MMQ, agosto/2019

Vale a pena insistir: resumo

Em nenhum momento foi feita qualquer hipótese quanto a forma da função densidade de probabilidade

dos dados.

YVXX)V(XA 1t11t ~ 11t

AX)V(XV

~

eAXY 0 Relação linear entre dados e parâmetros

A matriz de covariância dos dados deve ser conhecida (os erros são desconhecidos)

75 MMQ, agosto/2019

V – Algumas propriedades do MMQ e o TCL

(a) Não tendenciosidade

Espera-se que se y é uma medida de uma grandeza (um dado, uma média, o resultado de um ajuste...), seu valor esperado seja igual ao valor verdadeiro da grandeza,

0yy

76 MMQ, agosto/2019

resultado probabilidade 1,8 s 25% 2,0 s 50% 2,2 s 25%

• O MMQ é não tendencioso quando os dados também são não tendenciosos

Se yi representa os dados e <yi>=y0i, como yi=y0i+ei , onde ei é o erro, então <ei>=0.

YVXX)V(XA 1t11t ~

77 MMQ, agosto/2019

Vamos ver como fica o valor esperado de parâmetros ajustados pelo MMQ:

O valor esperado de Ã é

eAXY 0

YVXX)V(XA1t11t ~

Como os dados se relacionam com os parâmetros na forma

00 AXeAXY

então

78 MMQ, agosto/2019

portanto,

01t11t

1t11t

AXVXX)V(X

YVXX)V(XA

~

0AA ~

Conclusão: se os dados não são tendenciosos, os parâmetros ajustados pelo MMQ também

não serão tendenciosos

79 MMQ, agosto/2019

(b) Mínima variância

• Entre todas as estimativas não tendenciosas de parâmetros que dependem linearmente dos dados, o MMQ fornece aquelas com menor variância

2

21 xxx

2/22 x

80 MMQ, agosto/2019

• Exemplo: dois dados com mesmo desvio padrão σ e não covariantes. O resultado do MMQ é

Outra estimativa geral, linear nos dados e não tendenciosa:

21 )1( xaaxx

Qual valor de a leva à menor variância dessa estimativa? Por propagação de incerteza,

x a a2 2 2 21( ( ) )

81 MMQ, agosto/2019

• Derivando em relação à a e igualando a zero, obtemos a=1/2 e, portanto,

2

21 xxx

que é o resultado do MMQ:

82 MMQ, agosto/2019

(c) O Teorema Central do Limite

Exemplo: médias de dados uniformemente distribuídos entre zero e um.

0

2

4

6

8

10

a

83 MMQ, agosto/2019

Um só dado

O valor ajustado obedece a uma distribuição normal quando ele é resultado de muitos dados

• Média de dois, quatro e oito dados

0

2

4

6

8

10

12

b

0

5

10

15

20

d

0

5

10

15

c

84 MMQ, agosto/2019

• O TCL garante que

xx x xn n

n

1 12

2 22 2

12

22 21 1 1

tende uma gaussiana com desvio padrão igual a 1, quaisquer que sejam as f.d.p.s dos dados

85 MMQ, agosto/2019

O TCL no contexto do MMQ

Ã é uma média dos vários dados experimentais yi, com pesos inversamente às respectivas variâncias

YVXX)V(XA 1t11t ~

86 MMQ, agosto/2019

Desde que a quantidade de dados seja suficientemente grande, cada parâmetro deverá obedecer a uma distribuição

normal, independente da forma da f. d. p. de cada dado

Exemplo

y=a+bx, onde os diferentes valores yi obedecem a diferentes f.d.p.s

x y d.p. Tipo

-3 5,0 1,0 gaussiana

-2 3,5 0,3 uniforme

-1 2,3 0,7 tipo qui2

0 1,1 1,0 gaussiana

1 -0,6 0,5 binomial

2 -0,2 0,4 duas uniformes

3 -2,8 0,5 binomial

87 MMQ, agosto/2019

Parâmetros a e b ajustados: 1,20(18); -1,14(9) devem obedecer a uma f,d,p, gaussiana ou bem perto disso,

Seria exatamente gaussiana se a quantidade de dados fosse infinita

88 MMQ, agosto/2019

Ilustração com muitas simulações Valores ajustados de a e b

89 MMQ, agosto/2019

• a) Medida de uma grandeza altera valores de outras

• b) Como incorporar um dado perdido

• c) Vínculos entre parâmetros

• d) Média de dados correlacionados

VI – Outros desenvolvimentos

90 MMQ, agosto/2019

• As próximas transparências discutem esses problemas

MMQ, agosto/2019 91

• Exemplo: a e b foram medidos, obtendo-se os valores 10,0 e 20,0, com matriz de covariância

a) Medida de uma grandeza altera outras

108

810V

Uma medida independente de b forneceu o valor 25,0 com variância igual a 10. Vamos ao MMQ.

92 MMQ, agosto/2019

• Evidentemente, valor adotado para b foi alterado; seu d. p., idem.

• Menos evidente: o valor adotado para a é alterado e seu d.p., idem.

1000

0108

0810

V

25

20

10

Y

3

2

1

0

0

10

10

01

25

20

10

e

e

e

b

a

5,22

0,12 YVX'X)V(X'Ã

111

0,50,4

0,48,6V

93 MMQ, agosto/2019

b) Como incorporar um novo dado a um ajuste

Parâmetros a e b foram ajustados

94 MMQ, agosto/2019

𝑦 = 𝑎 + 𝑏𝑥

𝑨 =𝑎 𝑏

𝑽𝑨 =𝜎𝑎2 𝜌. 𝜎𝑎 . 𝜎𝑏

𝜌. 𝜎𝑎 . 𝜎𝑏 𝜎𝑏2

𝑥, 𝑦, 𝜎

𝑎 𝑏

𝑦 =

1 00 11 𝑥

∙𝑎0𝑏0

+

𝜀1𝜀2𝜀3

𝑽𝒂, 𝒃 ,𝒚 =

𝜎𝑎2 𝜌. 𝜎𝑎 . 𝜎𝑏 0

𝜌. 𝜎𝑎 . 𝜎𝑏 𝜎𝑏2 0

0 0 𝜎2

Novo dado é obtido

c) Vínculos entre parâmetros

• Exemplo: mede-se os três ângulos internos de um triângulo, digamos, 1, 2, e 3, sendo os resultados y1,σ1; y2, σ2; y3, σ3. Mas queremos impor a condição .

• Um procedimento geral é ajustar valores para os parâmetros, 1, 2 e 3, impondo o vínculo.

o180~~~

321

95 MMQ, agosto/2019

• Uma forma geral de escrever vínculo lineares:

g a rij j

j

m

i

1

onde aj são os parâmetros a serem ajustados e gij e ri são valores conhecidos.

No caso do triangulo só há um vínculo (r=180o) e todos os gs são iguais a 1.

96 MMQ, agosto/2019

A equações de vínculo podem ser escritas como

GA R

Solução do MMQ:

~~A V X V Y BC RA

t 1 1

V H BC BA~ 1 1 t

B H G 1 t C GH G 1 tH X V X t 1

97 MMQ, agosto/2019

Exemplo

Ângulos de um triângulo: 48o, 41o, 94º (soma=183o) todos com σ=1 e não covariantes. G=[1 1 1] e R=[180].

1 0 0

0 1 0

0 0 1

V

94

41

48

Y

98 MMQ, agosto/2019

Resultado: Valores ajustados: 47o, 40o, 93o . Soma é 180o: obedece vínculo. As variâncias diminuem

1 0 0

0 1 0

0 0 1

V

0,67 0,33- 0,33-

0,33- 0,67 0,33-

0,33- 0,33- 0,67

V

Vela a pena impor vínculos? Depende. Incertezas diminuem, mas surgem correlações.

P. ex., se o que queremos é apenas um dos ângulos, sim.

99 MMQ, agosto/2019

Breve resumo

• O MMQ deve ser usado: – Sempre que as incertezas dos dados sejam

conhecidas (ou todas sejam iguais)

–Há uma relação linear entre os dados e os parâmetros a serem ajustados

100 MMQ, agosto/2019

d)Média de dados correlacionados

Considere uma situação na qual temos n dados correspondentes à uma mesma grandeza, y1, y2, ... yn.

Para simplificar, vamos supor que todos tenham o mesmo desvio padrão 𝜎.

Método dos Mínimos Quadrados 101

Caso os dados fossem não correlacionados, o valor a ser adotado seria a média simples dos dados e o desvio padrão dessa média seria 𝜎 𝑛

Suponha, entretanto, que a matriz de covariância dos dados seja


𝐕 = 𝜎2

1 𝜌 ⋯ 𝜌𝜌 1 ⋱ ⋮

𝜌 𝜌 ⋯⋮1

Todas as variâncias são iguais a σ2.

Todas as covariâncias todas iguais a ρ·σ2.

O problema pode ser colocado dentro do esquema do MMQ, com y y e

y y e

y y en n

1 0 1

2 0 2

0

1

1

1

X

~yn

yi

i

n

1

1

~y

n

n

221


Os resultados para o valor adotado e a variância são

~yn

yi

i

n

1

1


Como no caso de dados não correlacionados, o valor adotado é a média simples dos dados

Resultado esperado, pois todas as variâncias e covariâncias são iguais e, portanto, nenhum dado poderia ter peso maior que os demais.

~y

n

n

221


A variância depende da correlação

Note que se ρ=0, a variância desse valor é 𝜎 𝑛 , como esperado, e tende a zero quando n tende a infinito

Se ρ não é nulo, entretanto, mesmo que n tenda a infinito, ρ·σ2. Conclusão: a covariância é um limite para a variância do valor adotado

• O ajuste é não tendencioso • Os dados não precisam obedecer a nenhum

f.d.p. particular • Se há uma quantidade grande de dados, as

f.d.p.s dos parâmetros ajustados tendem a formas gaussianas

• Não precisa haver uma relação funcional do tipo y=y(x) para usar o MMQ

• As covariâncias são tão importantes quanto as variâncias

106 MMQ, agosto/2019

Método dos Mínimos Quadrados - Indico IFSC (Indico) · •III – Variâncias e covariâncias;...

Documents

Transcript of Método dos Mínimos Quadrados - Indico IFSC (Indico) · •III – Variâncias e covariâncias;...