aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Transcript

Uso do WinBugs/OpenBugs

Diego Ignacio Gallardo Mateluna

Instituto de Matematica e EstatısticaUniversidade de Sao Paulo

Junho, 2012

Page 2: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Preliminares

O WinBugs e OpenBugs sao softwares livres que permitem simular de dis-tribuicoes a posteriori atraves do uso de algoritmos MCMC. A linguagemutilizada e similar a do R, mas o WinBugs/OpenBugs tem a seguinte estru-tura:

Especificacao da distribuicao da variavel resposta

Especificacao das distribuicoes a priori para os parametros

Leitura do banco de dados

Especificacao dos valores iniciais (optativo)

Page 3: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Preliminares

Entre as distribuicoes que estao disponıveis no WinBugs/OpenBugs estao asseguintes:

Distribuicoes discretas univariadasBernoulliBinomialCategoricaBinomial NegativaPoisson

Page 4: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Preliminares

Distribuicoes contınuas univariadasBetaChi-squaredDouble ExponentialExponentialGammaValor Extremo GeneralizadoGamma GeneralizadaPareto GeneralizadaLog-normalLogısticaNormalParetoT-StudentUniformeWeibull

Page 5: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Preliminares

Distribuicoes discretas multivariadasMultinomial

Distribuicoes contınuas multivariadasDirichletNormal multivariadaT-Student multivariadaWishart

Page 6: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao da distribuicao da variavel resposta

Por exemplo, se Yi ∼ N(µ, τ), i = 1, . . . , n, entao a especificacao do modeloe

for(i in 1:n)

{

y[i] ~ dnorm(mu,tau)

}

IMPORTANTE: N(µ, τ) no WinBugs/OpenBugs especifica a distribuicaoNormal de media µ e precisao τ . A variancia e dada por σ2 = 1/τ . Sempree bom verificar a parametrizacao utilizada pelo programa atraves do menuhelp/distributions.

Page 7: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao da distribuicao da variavel resposta

Se no modelo anterior quisermos uma covariavel xi, fazemos

µi = β0 + xiβ1, i = 1, . . . , n.

Nesse caso, a especificacao do modelo e

for(i in 1:n)

{

mu[i]<-beta0+x[i]*beta1

y[i] ~ dnorm(mu[i],tau)

}

Page 8: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao da distribuicao da variavel resposta

Outro exemplo: Se Yi e uma variavel binaria com probabilidade de sucessop, entao a especificacao do modelo e

for(i in 1:n)

{

y[i] ~ dbern(p)

}

Page 9: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao da distribuicao da variavel resposta

Se quisermos introduzir uma covariavel xi, esta podem ser incluıda atravesdo parametro p usando (entre outras) uma das seguintes ligacoes:

logito: logito(pi) = β0 + β1xi.

probito: probito(pi) = β0 + β1xi.

complemento log-log: cloglog(pi) = β0 + β1xi.

Por exemplo, para o caso de usar a ligacao logito, tem-se que a especificacaodo modelo e

for(i in 1:n)

{

logit(p[i])<-beta0+beta1*x[i]

y[i] ~ dbern(p[i])

}

Similarmente, as funcoes probito e complemento log-log estao implementadasem WinBugs, probit e cloglog respectivamente.

Page 10: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao da distribuicao da variavel resposta

Um caso mais geral: Suponha que estamos trabalhando com um modelo cujadistribuicao nao encontramos nas opcoes oferecidas com o WinBugs/OpenBugs,mas sabe-se que a contribuicao de cada indivıduo na funcao de verossimil-hanca e dada por log fi, em que fi e o nucleo da distribuicao da variavelresposta. Uma forma (nao e a unica) de programar esse modelo no Win-Bugs/OpenBugs e a seguinte:

c<-10000

for(i in 1:n)

{

logvero[i]<-logfi (especificar a forma de log fi)

zeros[i]<-0

aux[i]<--logvero[i]+c

zeros[i] ~ dpois(aux[i])

}

Neste caso, zeros e aux sao vetores auxiliares.

Page 11: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao da distribuicao da variavel resposta

Por exemplo: Em analise de sobrevivencia, suponha que e observado Zi =mın(Ti, Ci) e δi = I(Ti ≤ Ci) para i = 1, . . . , n. Se assumirmos que Ti ∼Exp(λ), entao tem-se que a contribuicao na log-verossimilhanca de cada ob-servacao e

log fi = −λzi + δi log λ, i = 1, . . . , n.

Portanto, neste caso a especificacao do modelo e

c<-10000

for(i in 1:n)

{

logvero[i]<--z[i]*lambda+delta[i]*log(lambda)

zeros[i]<-0

aux[i]<--logvero[i]+c

zeros[i] ~ dpois(aux[i])

}

Page 12: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao das distribuicoes a priori

A especificacao das distribuicoes a priori e bastante simples. Basta utilizaralguma das distribuicoes disponıveis no WinBugs/OpenBugs. Para β0 e β1

no modelo linear com covariaveis, podemos usar distribuicoes que assumamvalores nos reais. Alguns exemplos:

N(0, 10)

beta0~dnorm(0,0.1)

beta1~dnorm(0,0.1)

t5(0, 1)

beta0~dt(0,1,5)

beta1~dt(0,1,5)

Priori “Uniforme na reta”.

beta0~dflat()

beta1~dflat()

Esta ultima representa a distribuicao uniforme na reta real e so pode serutilizada para parametros que assumem valores em (−∞,∞).

Page 13: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao das distribuicoes a priori

No mesmo modelo linear, e como τ e positivo, podem ser usadas as seguintesdistribuicoes a priori.

Gama(1,1)

tau~dgamma(1,1)

Log-Normal(0,1)

tau~dlnorm(0,1)

NT(0,1,0) (Normal Padrao Truncada em zero)

tau~dnorm(0,1)I(0,)

Para “simular” o efeito de uma distribuicao impropria para um parametropositivo, pode ser utilizada uma distribuicao propria com uma varianciagrande. Por exemplo, se τ ∼Gama(0.001,0.001), entao a priori E(τ) = 1e V ar(τ) = 1000.

Page 14: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Leitura do banco de dados

A leitura do banco de dados deve ser feita dentro do mesmo codigo do Win-Bugs/OpenBugs, pois trabalhando diretamente com ele, nao pode ser lidoum banco de dados desde um arquivo externo. Serao exemplificadas duasformas de ler o banco de dados no WinBugs/OpenBugs.Uma primeira opcao e atraves do formato de lista. Por exemplo, no casodo modelo linear com uma covariavel, os dados podem ser lidos da seguinteforma:

list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

y=c(5,3,2.5,2,1.2,6.7,4,3.4,2.9,1))

Page 15: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Leitura do banco de dados

Uma segunda opcao e ler os dados em colunas. Seguindo com o mesmo exem-plo, os dados podem ser lidos da seguinte forma:

list(n=10)

x[] y[]

15 5

24 3

14 2.5

30 2

24 1.2

21 6.7

13 4

14 3.4

17 2.9

18 1

END

E muito importante colocar o comando END no final da leitura do banco dedados quando e utilizada esta forma para ler o banco de dados.

Page 16: Uso do WinBugs/OpenBugs - IME-USPmbranco/aula3Diego.pdf · do modelo linear com uma covari avel, os dados podem ser lidos da seguinte forma: list(n=10,x=c(15,24,14,30,24,21,13,14,17,18),

Especificacao de valores iniciais

Em modelos complexos, a especificacao de valores iniciais pode ajudar aconvergencia das cadeias. Mas, este passo e totalmente optativo no programa,pois podem ser usados valores iniciais gerados aleatoriamente. Por exemplo,no modelo linear com uma covariavel, podem ser especificados β0 = 0, β1 = 0e τ = 1.

list(beta0=0,beta1=0,tau=1)