Tipos de modelos · 2018-11-06 · Modelo de regressão não linear Os modelos de regressão linear...

Post on 13-Jun-2020

4 views 0 download

Transcript of Tipos de modelos · 2018-11-06 · Modelo de regressão não linear Os modelos de regressão linear...

Tipos de modelosTipos de modelos

Temos 3 tipos de modelos:

a) Lineares

b) Não lineares linearizáveis

c) Não lineares

1

a) Modelos Linearesa) Modelos Lineares

2

a) Modelos Linearesa) Modelos Lineares

a) Linearesa) Lineares:

A primeira derivada em relação a cada parâmetro, , não depende de nenhum parâmetro.

,f Xg X

Draper e Smith (1998)

Exemplo:

OO ModeloModelo LinearLinear

É um caso particular demodelagem estatística queengloba um grande número demodelos específicos(Regressão Linear, RegressãoPolinomial, Análise de

5210 xxy

10

f

xf

1 5

2

xf

Polinomial, Análise deVariância, Análise deCovariância)

É o mais completo e bemestudado tipo de modelo servede base para numerosasgeneralizações (Regressão nãolinear, Modelos LinearesGeneralizados, etc.)

3

b) Modelos Não Linearesb) Modelos Não Lineares

4

b) Modelos Não Linearesb) Modelos Não Lineares

Draper e Smith (1998)

)1(),,,( 3

21321

XeXf

Exemplo:

b) Não Linearesb) Não Lineares::

Quando a 1.a derivada da função com relação a algum dos parâmetros, ainda depende de algum dos parâmetros.

11

f

Xef

312

XXef

3

2

3

Ou seja, é o modelo que

mesmo usando uma

transformação, o modelo ainda é

não linear.

5

c) Modelos Não Lineares c) Modelos Não Lineares LinearizáveisLinearizáveis

Alguns exemplos particularmente frequentes de relações não-lineares que são linearizáveis.

6

a) Relação exponenciala) Relação exponencial

b) Relação potência (ob) Relação potência (ou AlométricaAlométrica))

c) Relação hiperbólica (oc) Relação hiperbólica (ou Proporcionalidade inversa)Proporcionalidade inversa)

d) Relação d) Relação MichaelisMichaelis--MentenMenten

e) Relação Logísticae) Relação Logística

c) Linearizáveisc) Linearizáveis::

Por meio de alguma transformação o modelo se torna linear.

Draper e Smith (1998)

Y = X. e

Exemplo:

Transformações Transformações linearizanteslinearizantes

Em alguns casos, arelação original entre X e Y énão-linear, mas pode serlinearizada caso se proceda a

dZX

d

ln(Y ) = X . ln() + ln(e)

Z = X . +

Inconveniente: altera a estrutura e distribuição do erro

linearizada caso se proceda atransformações numa, ou emambas as variáveis.

Tais transformaçõespodem permitir utilizar aRegressão Linear Simples(RLS), para estimar osparâmetros, apesar da relaçãooriginal ser não-linear.

7

a) Relação exponenciala) Relação exponencial

Transformação:: Logaritmizando, obtém-se:

)0;0(

;

y

eY X

XY

XY

**

)ln()ln(

8

XY **

que é uma relação linear entre Y* = ln(Y) e X.

Uma relação exponencial resulta de admitir que y é função de x e que a taxade variação relativa de y é constante:

)(

)('

xy

xy

isto é, a taxa de variação de y é proporcional a y: y’(x) = y(x).

b) Relação potênciab) Relação potênciaOu

AlométricaAlométrica

)0;0,( yxXY

TransformaçãoTransformação::Logaritmizando, obtém-se:

9

que é uma relação linear entre Y* = ln(Y) e X* = ln(X).

***)ln()ln()ln( XYXY

Uma relação potência resulta de admitir que Y e X são funções de t e que a taxa de variação relativa de Y é proporcional à taxa de variação relativa de X:

)(

)('

)(

)('

tx

tx

ty

ty

c) Relação hiperbólicac) Relação hiperbólicaOu

Proporcionalidade inversaProporcionalidade inversa

TransformaçãoTransformação:: Tomando recíprocos, obtém-se uma relação linearentre Y* = 1/Y e X:

XY

1

10

AplicaçãoAplicação: Usado na modelagem de rendimento por planta (Y) vs.

densidade da cultura ou povoamento (X).

entre Y* = 1/Y e X:

XYXY

*1

d) Relação d) Relação MichaelisMichaelis--MentenMenten

TransformaçãoTransformação:: Tomando recíprocos, obtém-se uma relação linearentre Y* = 1/Y e X* = 1/X, com * = d e * = c:

dXc

XY

11

,1 **** XYd

X

c

Y

Aplicações Em modelos de rendimento é conhecido como modelo Shinozaki-Kira, com Y orendimento total e X a densidade de uma cultura ou povoamento.

Nas pescas é conhecido como modelo Beverton-Holt com Y o recrutamento e X adimensão do manancial (sotck) de progenitores.

e) Relação Logísticae) Relação Logística

)(1

1Xe

Y

Transformação: Admitindo que y ]0,1[, tem-se uma relação linear entre a função logit de Y, ln(Y/(1 – Y)), e x:

12

XYXY

Y

*

1ln

)](1[)(

)('xy

xy

xy

Resulta de admitir que y é função de x e que a taxa de variação relativade y diminui com o aumento de x:

Advertência sobre transformações Advertência sobre transformações linearizanteslinearizantes

A Regressão Linear Simples (RLS) não modela diretamente relações não

lineares entre X e Y. A RLS modela a relação linear que se forma após a

transformação linearizante, ou seja, a relação linear entre as variáveis

transformadas.

13

Linearizar, obter os parâmetros a e b da reta e depois desfazer a

relação não linear não produz os mesmos valores dos parâmetros do que

tentar obter diretamente os valores que minimizam a soma de quadrados dos

resíduos na relação não linear.

Modelo de Regressão Não LinearModelo de Regressão Não Linear(MRNL)(MRNL)

Prof.a Dr.a Simone Daniela Sartorio de Medeiros

DTAiSeR-Ar

14

Modelo de regressão não linearModelo de regressão não linear

Os modelos de regressão linear tem aplicações nas diversas áreas doconhecimento. Entretanto, existem muitas situações em que esses tipos demodelos não podem ser apropriados.

Em aplicações mais realistas, especialmente, nos casos de crescimentobiológico, pode ser necessário o ajuste de funções não lineares que explicammelhor: o crescimento animal ou vegetal, bem como em estudos dadescrição da cinética de digestão de animais, como os ruminantes,

15

descrição da cinética de digestão de animais, como os ruminantes,descrição da dinâmica e disponibilização de nutrientes no sistema solo-planta, etc.

O modelo de regressão não linear pode ser escrito da seguinte forma:

Modelo de regressão não linearModelo de regressão não linear

nif iii ,...,2,1,, εθxy

em que:

Tni yyy ,,, 21 y é o vetor (n 1) das respostas obtidas nas ocasiões

Txxx ,,, x

16

Tni xxx ,,, 21 x

Tp ,,, 21 θ

Tni ,,, 21 ε

é o vetor (p 1) de parâmetros desconhecidos.

f é uma função não linear que depende do vetor de parâmetros . A função édiferenciável em relação a cada elemento do vetor .

é o vetor (n 1) de erros aleatórios, NIID.

E fy X, β

Quando se têm n observações da forma

1 2, , , ,u u u kuy x x x , com nu ,,2,1

1 2 1 2, , , ; , , ,u u u ku n uy f x x x β

Forma alternativa:

em que u é o u-ésimo erro, com u = 1, 2, ..., n.

,,, 21 kuuuu xxx xem que

u uy f ux ,β

Modelo abreviadoModelo abreviado

17

As pressuposiçõesAs pressuposições

As pressuposições em relação ao modelo segue similar aos modelos deregressão linear.

Entretanto, algumas pressuposições podem falhar, com por exemplo,os erros não apresentam distribuição normal. Tal distribuição pode pertencera uma outra família (não gaussiana) de distribuição. Nesse caso, emparticular, a variável resposta apresenta outra escala, portanto, deve-se usaros Modelos de Regressão Não Linear Generalizados (MRNLG).

18

os Modelos de Regressão Não Linear Generalizados (MRNLG).

Aqui consideraremos apenas os casos em que a distribuição é normal.

As As vantagensvantagens do MRNLdo MRNL

1) Sua escola está associada ao conhecimento prévio sobre a relação a sermodelada. Por exemplo: Peso Tempo.

2) Os parâmetros do modelo geralmente apresentam interpretaçãobiológica.

Processos como crescimento, decaimento, nascimento, mortalidade, competição e produção raramente são relacionadas linearmente as

19

competição e produção raramente são relacionadas linearmente as variáveis explicativas.

Nesse sentido, pode-se dizer que os MRNL melhor descrevem processosmecanísticos e são úteis por acomodarem as restrições referentes a taisprocessos.

Formulações de modelos são baseadas em considerações teóricas inerentes ao fenômeno que se tem interesse em modelar.

Modelo Modelo Solução de ED Solução de ED Modelo não linearModelo não linear

Modelo não linearModelo não linearAs variáveis respostas geralmente apresentam

um comportamento não linear

• Os parâmetros são biologicamente interpretáveis;

• Conhecimento e características teóricas dos dados (Ex.: assíntotas)

• Necessita-se de menos parâmetros

Interpretação

20

2

1

exp1

tty

Parâmetros são de fácil interpretação e características conhecidas.

O modelo logísticoO modelo logístico

23

3

exp1

em que,

1 : assíntota do modelo (Asym);

2 : o tempo até o indivíduo atingir ½ da resposta assintótica (xmid); e

3 : aproximadamente, ¾ da resposta assintótica (scal) .

tempo

1

t

21

Os parâmetros tem a mesma interpretação?

..\inferencias_do_modelo_logistico_sob_diferentes_parametrizacoes-1.pdf 22

As As desvantagensdesvantagens do MRNLdo MRNL

1) Requerem procedimentos iterativos de estimação baseados nofornecimento de valores iniciais para os parâmetros;

2) Métodos de inferência são aproximados;

3) Exigem conhecimento do pesquisador sobre o fenômeno alvo.

23

Estimação dos parâmetros Estimação dos parâmetros dodoMRNLMRNL

24

MRNLMRNL

Estimação dos parâmetrosEstimação dos parâmetros

a) Método dos Mínimos Quadrados:

a.1) Ordinários: não viola pressuposições;

a.2) Ponderados: viola homogeneidade;a.2) Ponderados: viola homogeneidade;

a.3) Generalizados: viola independência.

b) Método da Máxima Verossimilhança

25

Estimação dos parâmetros Estimação dos parâmetros –– Modelo linearModelo linear

x

n

yx

yx

n

in

n

ii

n

iin

iii

2

11

Os estimadores e de mínimos quadrados para e , respectivamente são:

xy ˆˆˆ

n

x

n

yn

ii

n

ii

11 ˆˆ

n

x

x iin

ii

1

1

2

Assim, a curva estimada é dada por:

Logo, encontrando os valores estimados de α e β obtém então

os valores esperados de Y.26

a) Método a) Método dos Mínimos Quadradosdos Mínimos Quadrados

Não exige pressuposições

Busca-se que minimize:β

2

Re1

,n

s u uu

SQ y f

x β Métodos

Iterativos

O SEN :

βx,f T

Não possui forma

Estimação dos parâmetros Estimação dos parâmetros –– Modelo não linearModelo não linear

Existem vários métodos numéricos iterativos:

Os métodos acima utilizam as derivadas parciais da função esperança f (x , ) com relação a cada parâmetro.

0βx,fyβ

βx,f

_ Método Gauss-Newton (da linearização);

_Método Steepest-Descent (do gradiente);

_Método de Marquardt.

_ Método de Newton;

_ Método Newton-Raphson;

_ Algoritmo EM;

Não possui forma fechada,

27

a.1) Método de Gaussa.1) Método de Gauss--NewtonNewton

y = f (x, ) +

y f (x, 0) + Z0 ( – 0 ) +

y – f (x, 0) = Z0 ( – 0 )+

0

y0 = Z0 0 + ==

y0

Expansão em série de Taylor de 1.a ordemem torno de um determinado 0, em que 0 é

o vetor de valores iniciais dos parâmetros.

Se SQRes(1) < SQRes(0) Repete o processo com 1 no lugar de 0,

isto é, 2 SQRes(2) , ... etc

0 = (Z0’ Z0)-1 Z0’y0^

Atualização do vetor de estimativas dos parâmetros (MQO)

Critério de Critério de ParadaParada

1 = 0 + 0^

Aproximar o modelo de

regressão NL com termos

lineares

28

Algumas vantagensvantagens:

As estimativas de mínimos quadrados podem ser facilmente obtidas;

Os estimadores são aproximadamente não viciados, normalmentedistribuídos com variância mínima, mesmo em pequenas amostras;

Os valores de previsões são mais precisos;

a.1) Método de Gaussa.1) Método de Gauss--NewtonNewton

Os valores de previsões são mais precisos;

Os métodos iterativos convergem mais rapidamente;

Os estimadores têm propriedades similares às propriedades ótimas de modelos lineares.

29

Solução não Método numérico

ValoreValore IniciaisIniciais A solução inicial pode estar demasiadamente distante do valor ótimo;

Má escolha dos valores iniciais resulta num número muito grande deiterações;

Pode convergir num mínimo local, ou, mesmo, não convergir;

Entretanto, bons valores iniciais podem levar a um mínimo global.

Rapidez da convergência

Qualidade dos valores iniciais

Complexidade do modelo

+

analítica iterativo

valores iniciais

30

Os modelos de regressão não linear descrevem relações não lineares entreas variáveis. Essas relações apresentam muitas formas.

São propriedades relevantes de uma função característica como ter pontoscríticos, inflexão, seu comportamento (concavidade, monotonicidade) ouaparentar padrões específicos (sigmoide, parabólico).

Para melhor compreender as relações não lineares entre x e y podemosfacilmente verificar alguns padrões, por meio de gráficos:

Alguns formatos de MRNLAlguns formatos de MRNL

31

Scatterplot

y:=100-50*exp(-2*x)

X

E(X

)

50

60

70

80

90

100

110

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5

Curvas de CrescimentoCurvas de Crescimento

A evolução de uma determinada característica (animal ou vegetal) em relação ao tempo (dias, meses, anos), em condições de crescimento contínuo, segue um

padrão comum nas espécies e sua representação gráfica origina uma curva designada curva de crescimento.

Geralmente, forma sigmoidalGeralmente, forma sigmoidal

32

Curvas de CrescimentoCurvas de Crescimento(não lineares nos parâmetros)

Modelo Fórmula

Brody y(t) = A [1 - B exp(-Kt)]

Von Bertalanffy y(t) = A [1 - B exp(-Kt)]3

Gompertz y(t) = A exp[- B exp(-Kt)]

em que: A é uma assíntota superior; B relacionado ao intercepto da curva; K taxa de crescimento da característica; M (Richards) forma à curva.

Logístico y(t) = A [1 + B exp(-Kt)]-1

Richards y(t) = A [1 - B exp(-Kt)]M

33

Ajuste de um modelo não linearAjuste de um modelo não linear

34

Ajuste de um modelo não linearAjuste de um modelo não linear

hora repet MS1 0 1 17.852 0 2 14.803 0 3 15.074 0 4 17.275 0 5 20.466 0 6 20.077 3 1 17.398 3 2 18.119 3 3 18.5010 3 4 16.0311 3 5 22.8312 3 6 21.7513 6 1 22.3214 6 2 21.0415 6 3 23.4316 6 4 19.5317 6 5 27.9418 6 6 23.9819 12 1 29.2120 12 2 30.2021 12 3 29.7822 12 4 32.52

Exemplo 1Exemplo 1

No R:repet<- rep(1:6, time=7)hora<- rep(c(0, 3, 6, 12, 24, 48, 72), each=6)MS<- c(17.85, 14.80, 15.07, 17.27, 20.46, 20.07, 17.39, 18.11,

18.50, 16.03, 22.83, 21.75, 22.32, 21.04, 23.43, 19.53,

a) Os dados observados:

Dados da porcentagem de degradabilidade ruminal in situ de MS do feno capim Tifton85 em ovinos.

35

22 12 4 32.5223 12 5 36.2724 12 6 31.7825 24 1 40.7326 24 2 40.9627 24 3 41.3628 24 4 43.8829 24 5 46.0030 24 6 39.1331 48 1 47.3432 48 2 51.3433 48 3 51.6134 48 4 53.3535 48 5 57.0736 48 6 49.4937 72 1 50.4138 72 2 54.6239 72 3 55.7240 72 4 56.2141 72 5 59.9342 72 6 55.12

18.50, 16.03, 22.83, 21.75, 22.32, 21.04, 23.43, 19.53,27.94, 23.98, 29.21, 30.20, 29.78, 32.52, 36.27, 31.78,40.73, 40.96, 41.36, 43.88, 46.00, 39.13, 47.34, 51.34, 51.61, 53.35, 57.07, 49.49, 50.41, 54.62, 55.72, 56.21,59.93, 55.12)

dados1<- data.frame(hora, repet, MS)dados1

# oudados<- read.csv2(“não_linear.csv”, head=T, dec=“.”)

attach(dados)names(dados)

No R:plot(hora, MS, , data=dados, pch=19)

Exemplo 1Exemplo 1

b) Conhecendo os dados

50

60

36

0 10 20 30 40 50 60 70

20

30

40

hora

MS

Modelo de Modelo de OrskovOrskov e McDonald (1979) e McDonald (1979) –– degradabilidadedegradabilidade in in situsitu

)1()( ctebatD

37

D(t) é a degradabilidade potencial ou desaparecimento dos componentesbromatológicos do alimento (%), no tempo t;a é a fração do alimento solúvel em água, ou rapidamente degradável;b é a fração insolúvel em água, mas potencialmente degradável em umdeterminado tempo, sob ação de microorganismos;c é a taxa de degradação da fração b; et é o tempo de incubação (h).

Modelo de Modelo de OrskovOrskov e McDonald (1979)e McDonald (1979)

)1()( ctebatD

38

c) Os dados tem a forma do modelo escolhido, nocaso, o modelo de Orskov e McDonald?

Exemplo 1Exemplo 1

No R:# O modelo de Orskov e McDonaldorskov = function(t,a,b,c) (a + b*(1-exp(-c*t)))

# Gráfico: valores observados e as tentativas de curva (valores iniciais)plot(hora, MS, pch=19)curve(orskov(x, 14, 40, 0.02), add=T, col="red")curve(orskov(x, 14, 40, 0.03), add=T, col="blue")curve(orskov(x, 14, 40, 0.01), add=T, col="green")

d) Quais os valores iniciais? Precisamos determinar valores iniciais para osparâmetros do modelo escolhido (no caso: a, b e c) para podermos estimar.

39

curve(orskov(x, 14, 40, 0.01), add=T, col="green")

0 10 20 30 40 50 60 70

20

30

40

50

60

hora

MS

No R:# valores iniciais para a, b e ca0= 14; b0= 40; c0= 0.04

#--- Curva obtida com os valores iniciaisplot(hora, MS, pch=19)curve(orskov(x,a0,b0,c0), add=T, col="red")

Exemplo 1Exemplo 1

60

40

0 10 20 30 40 50 60 70

20

30

40

50

hora

MS

No R:#-- Ajustando o modelo de oskov aos dadosmod <- nls(MS ~ orskov(hora, a, b, c), start=c(a=a0, b=b0, c=c0))

# Resumo do modelo não linear ajustadosummary(mod)

Formula: MS ~ orskov(hora, a, b, c)

Parameters:

Exemplo 1Exemplo 1

e) Ajustando o modelo não linear:

41

Parameters:Estimate Std. Error t value Pr(>|t|)

a 15.851229 0.886467 17.881 < 2e-16 ***b 42.741375 1.701888 25.114 < 2e-16 ***c 0.037428 0.004289 8.727 1.04e-10 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.855 on 39 degrees of freedom

Number of iterations to convergence: 4 Achieved convergence tolerance: 4.518e-06

)1(7414,428512,15)( 0374,0 tetD

No R:#--- Curva obtida com os valores obtidos pelo ajusteplot(hora, MS, pch=19)curve(orskov(x, coef(mod)[1], coef(mod)[2], coef(mod)[3]), add=T)

Exemplo 1Exemplo 1

50

60

42

0 10 20 30 40 50 60 70

20

30

40

50

hora

MS

Exemplo 1Exemplo 1

No R:# Intervalo de confiança dos parâmetrosconfint(mod)Waiting for profiling to be done...

2.5% 97.5%a 14.06255218 17.60966472b 39.54971748 46.53030181c 0.02933595 0.04619664

43

No R:# valores ajustadosMS_chapeu<- predict(mod)

# resíduo ordinário do modelores<- MS - MS_chapeu

# Teste de normalidade dos resíduosshapiro.test(res)

Exemplo 1Exemplo 1

24

6

44

shapiro.test(res)Shapiro-Wilk normality test

data: resW = 0.9714, p-value = 0.3676

# gráfico quantil-quantilrequire(car)qqPlot(res, pch=19)

# Critério de informação de AkaikeAIC(mod)[1] 212.1924

-2 -1 0 1 2

-4-2

0

norm quantiles

res