MODELOS LINEALES GENERALIZADOS - uv.es · GUION:¶ 1 Introducci¶on Motivaci¶on. Mortalidad por...

ESTADISTICA ESPACIAL EN EPIDEMIOLOGIA Y MEDIO AMBIENTE

DOCTORADO EN ESTADISTICA E I.O.

Universitat de Valencia (Estudi General)

Burjassot, Primavera de 2004

MODELOS LINEALES GENERALIZADOS

Antonio Lopez

Dep. d’Estadıstica i Investigacio Operativa

Universitat de Valencia (Estudi General)

Antonio.Lopez@uv.es

GUION:

1 IntroduccionMotivacion. Mortalidad por cancer de prostata en Valencia. Regresion

lineal.

2 Modelo Lineal Generalizado (GLM)Definicion. Componentes. Funcion vınculo. Modelos de datos

continuos. Modelos de datos discretos. Parametro de dispersion.

Sobredispersion.

3 Estimacion de un GLMMaxima Verosimilitud. Metodo Scoring de Fisher. Estimacion del

parametro de dispersion.

4 Seleccion del mejor modeloDesviacion. Modelos encajados.

5 Analisis de residuosResiduos de Pearson. Residuos de desviacion. Residuos por exclusion.

6 Extensiones de los GLMQuasi-verosimilitud. Otras extensiones.

7 EjemploMortalidad por cancer de prostata en Valencia.

Bibliografıa

MORTALIDAD POR CANCER DE PROSTATA.

VALENCIA 1975-1980

01 a 5

6 a 10>10

numero de defunciones acumuladas para el perıodo

TASAS DE MORTALIDAD POR CANCER DE

PROSTATA. VALENCIA 1975-80

0]0,5[

[5,10[[10,150[

tasas por 10000 habitantes

CONCENTRACION DE NITRATOS EN AGUAS

POTABLES

[ 0,10[[10,30[

[30,90[[90,300[

Concentracion de nitratos en mg/litro, Llopis (1985)

MODELOS DE REGRESION

yi = f(xi) + εi i = 1, . . . , n indep.

atributo enestudio

=componentesistematica

+componenteerratica

Esperanza[yi] = f(x)

Varianza[yi] = Varianza[εi]

Regresion lineal simple:f(xi) = β0 + β1xi

Ej.: mortalidadi=tasa×poblacioni+εi

i:= ındice de municipio

MODELOS DE REGRESION

yi = f(xi) + εi i = 1, . . . , n indep.

atributo enestudio

=componentesistematica

+componenteerratica

Esperanza[yi] = f(x)

Varianza[yi] = Varianza[εi]

Regresion lineal multiple:f(xi) = β0 + β1x1i + . . . + βkxki

Ej.: mortalidadi=∑

j(tasaj×poblacionji) +εi

i:= ındice de municipioj:= ındice de grupo de edad

C. DE PROSTATA EN VALENCIA (cont.)

NOMBRE DEL cancer conc. edad:

MUNICIPIO habit. prostata nitr. % ≥ 40

Ademuz 1545 1 11 59.0

Ador 1256 5 16 49.4

Adzaneta de Albaida 1364 0 18 42.7

Agullent 2016 0 8 35.8

Alaquas 23728 5 78 32.4

Albaida 5573 3 8 38.7

Albal 8139 4 17 36.0

Albalat de la Ribera 3594 2 76 42.2

Albalat dels Sorells 567 8 60 41.4

Albalat dels Tarongers 3657 0 32 53.4

Alberique 8971 1 28 42.9

Alborache 821 0 12 43.9

Alboraya 10786 4 42 39.2

Albuixech 3005 0 66 47.0

. . . . . . . . . . . . . . .

Datos de nitratos extraıdos de (Llopis, 1985)

REGRESION LINEAL SIMPLE

yi ∼ N(β0 + β1xi︸︷︷︸media

, σ2︸︷︷︸varianza

) i = 1, . . . , n

independ.

A partir de los n datos se obtienen las estimaciones:

β1 =∑

i(yi − y)(xi − x)n

∑i(xi − x)2

β0 = y − β1x

y se contrasta la hipotesis H0 : β1 = 0

casosi = β0 + β1 × nitratosi + εi

Ajuste

σ2: 16.88 con 261 grados de libertad

Multiple R2: 0.00007167

Estadıstico F : 0.01871 con 1 y 261 gr. libertad,

(p-valor=0.8913) resultado no significativo

Coeficientes Valor Std.Err. estad.t p-valor

Intercept. 3.0091 1.4558 2.0669 0.0397

nitratos 0.0032 0.0234 0.1368 0.8913

Residuos:

Min 1Q Median 3Q Max

-3.534 -3.06 -2.102 -0.3581 265.9

oooo oo o ooooo o o ooo

o oo ooo o ooo oo

o ooo o oo ooo oo oo oooo ooo oooo ooo oo ooo oo ooo o ooo ooo ooooo oo ooo oo oooo oo o oooo ooo oooo oooo o ooo ooo o oooo o oooo oooo oo

oo oo oo o oooo ooooo oo ooo oo oo oooo o o o oo oo ooo ooooo o ooo o ooo oo o o ooo ooo o oo o oooo o o o oo oooo ooo o oo ooo

oo oo o oo ooo

ooo ooo

o o ooo oo oo

oooo o

oo o oo ooo o oo oo

nitratos

0 50 100 150 200 250

ajuste de mortalidad vs. nitratos

oooooo

ooooooo

oooooo

ooooooooo

ooooooo

oooooooooo

oooooo

ooooooo

oooooooooooo

ooooooooooooo

ooooooooooo

ooooooooo

ooooooo

oooooo

ooooooooo

ooooooo

municipios

0 50 100 150 200 250

20residuos del ajuste eliminando municipio de Valencia

REGRESION LINEAL MULTIPLE

Aunque estemos interesados en un solo factor de riesgo, convieneincluir en el modelo todos aquellos cuya influencia se sospecha. Conello evitaremos estimaciones sesgadas del factor de interes yconclusiones posiblemente equivocadas.

Ajustandoyi = α0 + α1x1i + εi

y el modelo con factores de riesgo x2, . . . , xk adicionales

yi = β0 + β1x1i + . . . + βkxki + εi

en general se obtiene α1 6= β1

La tabla de ANOVA permite valorar la hipotesis de que todos loscoeficientes de regresion son nulos a la vez, ası como la coleccion dehipotesis de que cada uno de ellos es irrelevante una vez consideradoslos restantes.

casosi = β0 + β1 × poblacioni

+ β2 × envejecimientoi

+ β3 × nitratosi + εi

Ajuste

σ2: 2.058 con 259 grados de libertad

Multiple R2: 0.9852

Estadıstico F : 5765 con 3 y 259 grad. de lib,

(p-valor < 0,00005) muy significativo

Coefs. Estim. StdErr. estad.t p-valor

Intercept. -1.5897 0.8538 -1.8618 0.0638

poblacion 0.0004 0.0000 130.60 0.0000

envejec. 3.5904 1.7374 2.0665 0.0398

nitratos 0.0061 0.0030 2.0291 0.0435

Residuos

Min 1Q Median 3Q Max

-8.765 -0.7577 -0.3334 0.5301 11.65

Incremento R2 ≈ 0.9851

DIAGNOSTICO DEL MODELO

ooooooooo

ooooooooooooooooo

oooooo

ooooooo

oooooooo

ooooooooooo

oooooo

ooooooo

oooooooo

oooooo

oooooooooooo

municipio

0 50 100 150 200 250

ajuste de mortalidad vs. pobl., envej. y nitratos

DIAGNOSTICO DEL MODELO

o oooo

o ooo o

ooo ooo

oooo o ooo

ooo oooo

ooo oo

oo ooooo

oooo o

oo o ooooo

o o o oo

oooo o ooo o

oooo oo

o o oo

ooo oo

o oo ooo

oo oo o

ooo o oo

nitratos

0 50 100 150 200 250

mortalidad ajustada para demografia vs. nitratos

Introduccion

Modelo Lineal General: datos independientes, y1, y2, . . . , yn,normalmente distribuidos.

yi ∼ N(β0 + β1x1i + . . . + βpx

pi , σ

predictor lineal β′xi

varianza constante

E[y] = Xβ, V[y] = σ2I

Modelo Lineal Generalizado: datos independientes de unadistribucion de la familia exponencial (binomial, Poisson,gamma, . . .).

modeliza E[y] como una funcion no lineal de Xβ.

Introduccion

Analisis de un GLM:

calculo del estimador maximo verosımil

comparacion de modelos encajados

valoracion del ajuste del modelo a los datos

Definicion de GLM

Conjunto de variables aleatorias independientes y1, y2, . . . , yn confuncion de densidad, o funcion de probabilidad, que puede escribirsecomo:

p(yi | θi, φ) = exp{yiθi − b(θi)ai(φ)

+ c(yi, φ)}

donde:θi es el parametro natural o canonico

φ es un parametro adicional de escala o dispersion

ai(·), b(·) y c(·) son funciones especıficas

Si φ es conocido este es un modelo de la familia exponencial lineal

Si φ es desconocido es un modelo de dispersion exponencial

Definicion de GLM

Bibliografıa general:Nelder y Wedderburn (1972)McCullagh y Nelder (1989)Fahrmeir y Tutz (1994)Garthwaite et al. (1995)

Componentes del GLM

Queremos modelizar µi = E[yi] en terminos del predictor lineal β′xi

formado con un conjunto de p covariables

β′xi = β0 + β1x1i + . . . + βpx

Componentes:

1 Conjunto de n variables respuesta independientes, de unadistribucion de la familia exponencial

2 Un vector de parametros β y una matriz del modelo X,determinando el predictor lineal de cada variable β′xi

3 Una funcion vınculo monotona y diferenciable que define larelacion entre µi y su predictor lineal

g(µi) = β′xi

Funcion vınculo

Permite modelizar distintas relaciones entre µ y el predictor lineal.

Vınculo natural o canonico:Aquel que es igual a la funcion que define el parametro natural ocanonico de esa distribucion. Por tanto, θ = β′x

Funcion vınculo

Vınculos mas usuales:

¦ logit log π1−π

¦ probit Φ−1(π)

¦ complementario

log-log log[− log(1− π)]

¦ identidad µ

¦ inverso −1/µ

¦ logaritmo log µ

¦ raiz cuadrada√

Eleccion del vınculo: depende de la familia de distribuciones, deltipo de respuestas y de la aplicacion.

Modelos de datos continuos

Normal:

Distribucion N(µ, σ2)

E[y] = µ

vınculo g(µ) = µ (identidad)

b(θ) = θ2/2

a(φ) = σ2

Otros vınculos: logaritmo

raiz cuadrada

Modelos de datos continuos

Gamma:

Distribucion Gamma(λ, ν)

E[y] = λν

vınculo g(µ) = − 1µ = − ν

λ (inverso)

b(θ) = − log(−θ)

a(φ) = 1λ

Otros vınculos: identidad

logaritmo

Modelos de datos discretos

Binomial:

Distribucion Bi(n, π)

E[y] = nπ

vınculo g(µ) = log µn−µ = log π

1−π (logit)

b(θ) = n log(1 + eθ)

a(φ) = 1

Otros vınculos: probit

complementario log-log

Modelos de datos discretos

Poisson:

Distribucion Po(λ)

E[y] = λ

vınculo g(λ) = log λ (logaritmo)

b(θ) = eθ

a(φ) = 1

Otros vınculos: identidad

raiz cuadrada

Parametro de dispersion

Con frecuencia, el termino ai(φ) es de la forma φ/ωi, donde ωi es unpeso.

Si los datos no son agrupados, ωi = 1

Si las variables respuesta expresan promedios, ωi = ni

Si son la suma de ni respuestas individuales, ωi = 1/ni

Sobredispersion

Fenomeno que ocurre en aplicaciones con distribuciones con varianzapoco flexible, como Binomial y Poisson.

Al anadir un parametro de dispersion φ, se modifica la varianza

V[y] = a(φ)b′′(θ)

Puede representar una heterogeneidad no observada o una correlacionpositiva entre respuestas individuales.

Tambien se denomina extravarianza.

Maxima verosimilitud

El logaritmo de la verosimilitud de θ para las observaciones y es

l(θ | y) =n∑

yiθi − b(θi)ai(φ)

c(yi, φ)

Nuestro principal interes es la estimacion de β. El estimadormaximo verosımil de cada βj anula la derivada de l

∂βj=

(yi − µi)xij

V[yi]g′(µi)

Maxima verosimilitud

En general, estas ecuaciones de estimacion no se pueden resolverdirectamente. Su solucion puede aproximarse por procedimientositerativos, empleando la esperanza de las segundas derivadas

∂βj∂βk

xijxik

V[yi]g′(µi)2

Metodo Scoring de Fisher

Algoritmo de Newton-Raphson:Procedimiento iterativo a partir de una estimacion inicial β0:

βr+1 = βr − [D2βl(βr)]−1Dβl(βr)

donde Dβl(βr) es el vector de primeras derivadas de l, y D2βl(βr)

la matriz de segundas derivadas, evaluadas en βr.

Metodo Scoring de Fisher:Consiste en sustituir D2

βl(βr) por su valor esperado.

∂βj∂βk

xijxik

V[yi]g′(µi)2

Equivale a resolver iterativamente un problema de mınimoscuadrados ponderados (Jorgensen, 1983).

La sucesion {βr} converge al estimador maximo verosımil de β.

Estimacion del

parametro de dispersion

Si φ no es conocido, es necesario usar una estimacion para el calculode V[yi] en el procedimiento anterior.

Cuando ai(φ) = φ/ωi, la expresion de la varianza

V[yi] = ai(φ)b′′(θi)

proporciona un estimador consistente de φ a partir de unaestimacion de β

n− p− 1

ωi(yi − µi)2

b′′(θi)

Estimacion del

parametro de dispersion

Para la normal, el estimador de la varianza del modelo de regresionlineal es la suma de cuadrados residual

σ2 =1

n− p− 1

(yi − µi)2

Desviacion

Determinaremos la adecuacion del modelo comparandolo con elmodelo saturado.

El modelo saturado tiene la misma forma que el ajustado, perocon tantos parametros como observaciones.

Desviacion escalada: obtenida con el estadıstico cociente deverosimilitudes

S = −2[l(β | y, φ)− l(β | y, φ)]

con β el EMV del modelo saturado.

Desviacion

En terminos del parametro natural es

S = 2n∑

yi(θi − θi)− b(θi) + b(θi)ai(φ)

Cuando φ es conocido, la desviacion escalada mide cuanto se desvıael modelo de los datos.

Distribucion aproximada:Si el modelo se ajusta bien a los datos

S ∼ χ2(n− p− 1)

Desviacion

Desviacion (no escalada):Se define por

D(y, µ) = φS

Si ai(φ) = φ/ωi, equivale a

ωi[yi(θi − θi)− b(θi) + b(θi)]

Descomposicion de la desviacion:La desviacion es la suma de las discrepancias para cada uno delos datos

D(y, µ) =n∑

di(yi, µi)

Desviacion

Estimacion de φ:La desviacion de un modelo razonable con q parametros permiteestimar φ mediante

φ = D/(n− q)

debido a que la esperanza aproximada de S es igual a n− q, losgrados de libertad de la distribucion χ2

Modelos encajados

La desviacion es util para comparar el ajuste de dos modelosencajados.

Un modelo M1 con q1 parametros esta encajado en otro M2 con q2

parametros (q1 < q2) si son de la misma forma y las covariablesde M1 estan contenidas en las de M2.

La necesidad de los q2 − q1 parametros adicionales se contrasta conun test χ2. Si D1 y D2 son las desviaciones de dos modelosencajados con buen ajuste,

(D1 −D2)/φ ∼ χ2(q2 − q1)

Modelos encajados

Si φ tiene que ser estimado, puede hacerse el contraste con un testF, usando

(D1 −D2)(n− q2)(q2 − q1)D2

∼ F(q2 − q1, n− q2)

Analisis de residuos

El residuo de cada dato mide la discrepancia entre el valor observadoy el pronosticado por el modelo.

Residuos de Pearson: Generalizacion inmediata de los residuoshabituales para datos normales

yi − µi√b′′(θi)

Residuos de desviacion: Es la contribucion de esa observacion ala desviacion escalada

rDi = signo(yi − µi)

√di/φ

Residuos por exclusion: Es el residuo de ese punto para el modeloajustado al excluir esa observacion. Pueden calcularse residuospor exclusion de Pearson y de desviacion.

Quasi-verosimilitud

A veces no se conoce la forma de la distribucion de las variablesrespuesta, pero se dispone de la esperanza en funcion de β

E[yi] = µi(β)

y la formula de la varianza en su relacion con la esperanza

V[yi] = φV(µi)

Estimador por quasi-verosimilitudEs la solucion de

D′W (y − µ(β)) = 0

donde el elemento (i, j) de D es ∂µi

∂βjy W es la matriz diagonal

con elementos V(µi)−1.

Quasi-desviacionComo la desviacion, sustituyendo por la quasi-verosimilitud.

Otras extensiones

Modelos de regresion no linealEmpleando un predictor no lineal en los parametros β.

Modelos de regresion generalUtilizando distribuciones que no son de la familia exponencial.

Modelos de regresion multivarianteLa variable respuesta es un vector, introduciendo los GLMmultivariantes(Fahrmeir y Tutz, 1994).

O las respuestas no son independientes, como en el caso espacial,llevando a los modelos autoregresivos y a los jerarquicos.

Mortalidad por cancer de prostata en Valencia

Estimacion del modelo.

Parametros estimados

MODELO β0 β1 β2

tasas const. -7.172

edad -9.925 5.208

nitratos -7.876 1.23e-3

edad y nit. -10.152 5.539 2.09e-3

Mortalidad por cancer de prostata en Valencia

Diferencias entre las desviaciones de los modelos encajados.

const. edad nit. comp.

tasas const. 849.8

edad 488* 361.8

nitratos 443* — 406.8

edad y nit. 495.9* 7.9* 52.9* 353.9

Todas significativas con α = 0,01.

Bibliografıa

Fahrmeir, L. y Tutz, G. (1994). Multivariate statistical modelling based

on generalized linear models. Springer-Verlag, New York.

Ferrandiz, J., Lopez, A., Llopis, A., Morales, M., y Tejerizo, M. L.

(1995). Spatial interaction between neighbouring counties: cancer

mortality data in Valencia, (Spain). Biometrics, 51(2):665–678.

Garthwaite, P. H., Jolliffe, I. T. y Jones, B. (1995). Statistical Inference.

Prentice Hall, London.

Jorgensen, B. (1983). Maximum likelihood estimation and large-sample

inference for generalized linear and nonlinear regression models.

Biometrika, 70:19–28.

McCullagh, P. y Nelder, J.A. (1989). Generalized linear models, second

edition. Chapman and Hall, London.

Nelder, J.A. y Wedderburn, R.W.M. (1972). Generalized linear models.

Journal of the Royal Statistical Society, series A, 135:370–384.

MODELOS LINEALES GENERALIZADOS - uv.es · GUION:¶ 1 Introducci¶on Motivaci¶on. Mortalidad por...

Documents

Transcript of MODELOS LINEALES GENERALIZADOS - uv.es · GUION:¶ 1 Introducci¶on Motivaci¶on. Mortalidad por...

Labo Dilataciion Lineal

EXA FINAL ALGEBRA LINEAL 20112 NAO.docx

T2. El modelo lineal simple

Metodos y Modelos de Programacion Lineal Borrosa

Aplicaciones del algebra lineal

Algebra Lineal: Combinación Linealcb.mty.itesm.mx/ma1010/materiales/algebra-lineal-combinacion-lineal.pdf · Algebra Lineal: Combinaci on Lineal Departamento de Matem aticas Intro

Sistemas de Gestão Lineal

Tom M. Apostol CALCULUS II...4.2 Autovectores y autovalores de una transformación lineal 120 4.3 Independencia lineal de autovectores correspondientes a auto-valores distintos 123

CÁLCULO DIFERENCIAL MULTIVARIADO Y ÁLGEBRA LINEAL 2012 · CÁLCULO DIFERENCIAL MULTIVARIADO Y ÁLGEBRA LINEAL Unidad 1: f unciones de va rias variables 3 La gráfica de esta función

BRAQUITERAPIA Y ACELERADOR LINEAL

DIESEL-BOMBA INYECTORA LINEAL de practicos 2021/TPS/6... · 2021. 3. 4. · DIESEL-BOMBA INYECTORA LINEAL Circuito de Alimentación El combustible diesel sale del tanque (1) aspirado

Dibuix lineal del natural 4teso

Aa-019gyr051-e9-2016 Mantenimiento Prev y Correct Acelerador Lineal

ancer - ccv-ma.org.br€¦ · Ancer reúne três momentos do trabalho do artista mara-nhense Claudio Costa. Por volta do ano 2000, Claudio partiu em busca de uma vivência mais profunda

Enseñanza de la Cinemática Lineal en su representación gráfica: Ensayo en … · 2013-07-08 · VIII Enseñanza-aprendizaje bajo un enfoque constructivista de la Cinemática Lineal

Sebasti an Barbieri · 2021. 8. 5. · Cap tulo 5. Algebra lineal num erica 103 5.1. Algoritmo de Gauss y pivoteo parcial 106 5.2. Descomposici on LU y LDU 108 5.3. Descomposici on

Matem´aticas aplicadas a las CCSS Coleccion de Ejercicios´ PROGRAMACION LINEAL · 2020. 10. 11. · Matem´aticas aplicadas a las CCSS Coleccion de Ejercicios´ PROGRAMACION LINEAL

Algebra Del Lineal Historia

Sistemas de edición lineal(1)

Fusión de Imágenes Multi Foco basado en la Combinación ... · Palabras Clave: Programacion lineal, fusi´ ón de im ágenes multi foco, filtros pasa altas, imágenes incrementales