MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... -...

24
MODELOS DE TRANSIC ¸ ˜ AO P ARA DADOS B IN ´ ARIOS: TESTES P ARA COMP ARAR TRATAMENTOS Idemauro Antonio Rodrigues de LARA 1 C larice G arcia B orges D E M ´ E T RIO 1 D alton F rancisco de AN D RAD E 2 J o˜ ao M aur´ ıcio Ara´ ujo M O T A 3 RESUMO: O enfoque do presente trabalho ´ e dado aos modelos lineares generalizados de transi¸c ˜ ao adequados para a an´alise de dados longitudinais envolvendo uma resposta do tipo bin´aria. Esses modelos s˜ao baseados em processos estoc´asticos e, o interesse est´a em modelar as probabilidades de mudan¸ cas ou transi¸c˜ oes de c ategorias de respostas dos indiv´ ıduos no tempo. O m´ etodo da m´axima verossimilhan¸ ca ´ e utilizado para o ajuste dos modelos e estima¸c˜ ao das probabilidades. A dicionalmente, s˜ao apresentados testes assint´ oticos para comparar tratamentos, baseados na raz˜ao de chances e na diferen¸ca das probabilidades de transi¸c˜ ao. Os m´ etodos s˜ao ilustrados com um conjunto de dados sobre doen¸ca respirat´oria. P ara esses dados, o processo ´ e considerado estacion´ario de ordem dois e o teste proposto, sinaliza diferen¸ca estatisticamente signifi cativ a a fav or do tratamento ativ o. PA L A V RA S-C H A V E: D ados longitudinais; modelo linear generalizado; proc essos estoc´asticos;probabilidades de transi¸c˜ao;m´axima verossimilhan¸ca. 1 Introdu¸c˜ ao D ados bin´arios s˜ao comuns em muitas ´areas das ciˆencias, nas quais, muitas vezes, h´a interesse em registrar a ocorrˆencia, ou n˜ao, de um evento particular. N os 1 Departamento de Ciˆ encias Exatas, Escola Superior de Agricultura ”Luiz de Queiroz”, Universidade de S˜ao P aulo ESALQ/USP , CEP : 13418-900, P iracicab a, S˜ao P aulo, B rasil. E-mail: [email protected] / c [email protected] 2 Departamento de Inform´atica, Universidade F ederal de Santa Catarina – UF SC, CEP : 8 8 0 4 0 -9 7 0 , F lorian´opolis, SC, B rasil. E-mail: dan drade@in f.ufsc.br 3 Departamento de Estat´ ıstica, Universidade F ederal do CEAR ´ A – UF C, CEP : 6 0 0 2 0 -1 8 1 , F ortaleza, CE, B rasil. E-mail: oic iruam@ufc .br R ev . B ras. B iom., S˜ao P aulo, v.2 5 , n.4 , p.7 7 -1 0 0 , 2 0 0 7 77

Transcript of MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... -...

Page 1: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

MODELOS DE TRANSICAO P ARA DADOS B INARIOS: TESTES

P ARA COMP ARAR TRATAMENTOS

Idemauro Antonio Rodrigues de LARA1

C larice G arc ia B orges D E M E T RIO 1

D alton F ranc isco de AN D RAD E 2

J oao M aurıc io Araujo M O T A3

RESUMO: O enfoque do presente trabalho e dado aos modelos lineares generalizados de

transic ao adequados para a analise de dados longitudinais env olv endo uma resposta do

tipo binaria. Esses modelos sao baseados em processos estoc asticos e, o interesse esta

em modelar as probabilidades de mudancas ou transic oes de categorias de respostas dos

indiv ıduos no tempo. O metodo da max ima v erossimilhanca e utilizado para o ajuste

dos modelos e estimac ao das probabilidades. A dic ionalmente, sao apresentados testes

assintoticos para comparar tratamentos, baseados na razao de chances e na diferenca

das probabilidades de transic ao. Os metodos sao ilustrados com um conjunto de dados

sobre doenca respiratoria. P ara esses dados, o processo e considerado estac ionario de

ordem dois e o teste proposto, sinaliza diferenca estatisticamente signifi cativ a a fav or do

tratamento ativ o.

P A L A V RA S-C H A V E: D ados longitudinais; modelo linear generalizado; processos

estoc asticos; probabilidades de transic ao; max ima v erossimilhanca.

1 Introducao

D ados b inarios sao comuns em muitas areas das c ienc ias, nas q uais, muitas

v ezes, h a interesse em registrar a ocorrenc ia, ou nao, de um ev ento p articular. N os

1Departamento de Ciencias Exatas, Escola Superior de Agricultura ”Luiz de Queiroz”, Universidadede Sao P aulo – ESALQ/USP , CEP : 1 3 4 1 8 -9 0 0 , P iracicab a, Sao P aulo, B rasil. E-mail:[email protected] / c [email protected]

2Departamento de Informatica, Universidade F ederal de Santa Catarina – UF SC, CEP : 8 8 0 4 0 -9 7 0 ,F lorianopolis, SC, B rasil. E-mail: dan drade@in f.ufsc.br

3Departamento de Estatıstica, Universidade F ederal do CEAR A – UF C, CEP : 6 0 0 2 0 -1 8 1 , F ortaleza,CE, B rasil. E-mail: [email protected]

R ev . B ras. B iom., Sao P aulo, v.2 5 , n.4 , p.7 7 -1 0 0 , 2 0 0 7 7 7

Page 2: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

estudos longitudinais, com resposta dessa natureza, existe uma dicotomia conceituale metodologica para a analise desses dados. S abe-se que a escolha do modelo aser utilizado depende basicamente dos objetivos do experimento por ocasiao doplanejamento da pesquisa. O ajuste dos modelos marginais por meio das equacoes deestimacao generalizadas, EEGs, (LIANG; Z EGER, 19 8 6 ; Z EGER; LIANG, 19 8 6 ),permitem modelar estruturas de correlacao e resultam em estimativas consistentespara os parametros de regressao. No entanto, esses modelos nao permitem avaliaro comportamento das mudancas de respostas em cada ocasiao. P ortanto, paraatender a esse objetivo, deve-se optar por um modelo de transicao. Em particular,para dados binarios, os modelos de transicao se caracterizam pelas probabilidadescondicionais de resposta no tempo t, dada a historia passada da unidade amostralou experimental. Devido a isso, esses modelos sao tambem baseados em processosestocasticos, uma vez que o interesse e estimar as probabilidades de transicao, istoe, as probabilidades de passar de uma categoria para a outra em ocasioes sucessivas.

H a varios tipos de processos estocasticos que podem ser considerados emum modelo de transicao, mas, em geral, a propriedade mark oviana e a suposicaoestocastica mais frequentemente adotada. Neste trabalho, o enfoque e direcionadopara a cadeia de Mark ov, uma vez que a variavel resposta tem espaco de estadosdiscreto, S = {0, 1}, e, o tempo, tambem e considerado discreto τ = {0, 1, 2, . . . , T}.Assim, a descricao das mudancas ou transicoes das observacoes entre uma ocasiao eoutra e caracterizada estocasticamente por matrizes de probabilidades de transicao,de dimensoes 2× 2. P ara estabelecer a notacao, considere a propriedade de Mark ovpara cadeias de primeira ordem:

πab(t) = P (Xt = b | X(t−1) = a) (a, b ∈ S),

a qual leva as matrizes de probabilidades,

P (t) =

(

π0 0 (t) π0 1(t)π10 (t) π11(t)

)

ou P =

(

π0 0 π0 1

π10 π11

)

,

em que o parametro (t) denota a dependencia em relacao ao tempo, havendo nessecaso, T matrizes de transicao. A matriz P e a matriz associada a um processoestacionario ou homogeneo no tempo. Registra-se que a cadeia pode ter alcancemaior do que 1. P ara uma cadeia de Mark ov de ordem 2, a propriedade de Mark ovestabelece que a caracterizacao completa do estado do sistema num dado tempo t

necessita da informacao dos estados do sistema nos dois tempos precedentes. Assim:

πabc (t) = P (Xt = c | X(t−1) = b, X(t−2) = a) (a, b, c ∈ S).

Logo, o processo e caracterizado por matrizes de probabilidades de transicao dedimensoes 4 × 2:

P (t) =

π0 0 0 (t) π0 0 1(t)π0 10 (t) π0 11(t)π10 0 (t) π10 1(t)π110 (t) π111(t)

,

78 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 3: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

para t = 2, 3, 4, . . . , T .Alguns trabalhos como os de Anderson e Goodman (195 7 ), Goodman (1962),

Bishop, Fienberg e Holland (197 5 ), Agresti (1991), Fitzmaurice e Laird (1993),Lindsey (1995 , 2004) descrevem que as mudancas ou transicoes de categorias deresposta no tempo, quando a amostra e homogenea, podem ser estudadas atraves detecnicas aplicadas a tabelas de contingencia. Na pratica, porem, conforme destacaNoleto (1991), difi cilmente a amostra e considerada homogenea. U ma alternativapara esses casos e especifi car um modelo para descrever a relacao funcional dedependencia dessa probabilidade em relacao ao conjunto de covariaveis consideradasno estudo. Os modelos lineares generalizados (MLG) podem ser usados para talproposito. Algumas referencias classicas com dados binarios sao Cox (197 0), K orne W hittemore (197 9), Azzalini (1983), Zeger, Liang e Self (1985 ).

Nesse sentido, um modelo de transicao envolve teoricamente metodos dosmodelos lineares generalizados e tecnicas de processos estocasticos, uma vezque alem da estimacao dos parametros deseja-se verifi car, por exemplo, aestacionariedade. Esse fato e de importancia para dados categorizados e, emparticular para dados binarios, em que se tem interesse em obter as matrizesde probabilidades de transicao, que para o caso de nao rejeicao da hipotese deestacionariedade sao consideradas estocasticamente iguais, e, portanto, o modelode transicao pode ser sintetizado por uma unica matriz de probabilidades.

De certa forma, seja o processo estacionario ou nao, uma questao de interessepratico que parece relevante e poder comparar os diferentes tratamentos envolvidosa partir das matrizes de probabilidades de transicao. Esses problemas, em geral,aparecem como lacunas na literatura desses modelos, justifi cando estudos nessaarea. Nesse contexto, este trabalho tem dois objetivos: o primeiro e apresentar osfundamentos basicos dos modelos de transicao para analise de dados longitudinaise o segundo e defi nir hipoteses para comparacao de tratamentos e apresentarpropostas de testes mais apropriados para esses casos.

2 Material e metodos

2.1 Material

Os dados desse exemplo referem-se a um ensaio clınico, envolvendo doencarespiratoria, extraıdo do trabalho de K och et al. (1990). O estudo envolve 111pacientes com problemas respiratorios de dois centros medicos (5 6 do Centro 1 e 5 5do Centro 2), nos quais os indivıduos sao aleatorizados para receber um tratamentoativo ou placebo. O objetivo do estudo e avaliar o efeito da droga ativa sob acondicao respiratoria.

No trabalho original de K och et al. (1990), o status respiratorio de cadapaciente e qualifi cado de acordo com um conjunto de cinco categorias ordinais,que expressam uma classifi cacao da resposta menos favoravel a mais favoravel(0=terrıvel, 1=ruim, 2=razoavel, 3=bom, 4=excelente). Essa escala e usada paraavaliar a saude (respiracao) dos indivıduos no inıcio do estudo (baseline) e em mais

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 79

Page 4: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

quatro visitas igualmente espacadas, durante o perıodo no qual os tratamentos(ativo, placebo) sao administrados. As demais covariaveis, sexo e idade (em anos)sao obtidas na ocasiao de entrada dos indivıduos no estudo.

A simplificacao das classificacoes observadas para medidas dicotomicas sao 0(terrıvel ou ruim ou razoavel) e 1 (bom ou excelente). Com essa classificacao, essesdados tem sido usados na literatura como exemplo para abordagem de modelosmarginais por meio das EEGs, seguindo a proposta de Liang e Zeger (1986). Nestetrabalho, por simplicidade, faz-se referencia ao estado de saude (respiracao dopaciente) como bom (1) ou ruim (0).

2.2 Metodos

2.2.1 Defi n ic ao do m odelo

Considere um estudo longitudinal e seja, yi o vetor de variaveis respostasdo i-esimo indivıduo, de dimensoes ni × 1, isto e, yi = (yi1, yi2, . . . , yin i

)′, de talforma que numa ocasiao t, a observacao yit esteja associada um vetor de variaveisexplicativas (p × 1), xit = (xit1, . . . , xitp )

′. De acordo com Diggle et al. (2002),um modelo de transicao de Markov especifica um modelo linear generalizadopara a distribuicao condicional de Yit dadas as respostas passadas. Assim, sejahit = (yi1, yi2, . . . , yi,(t−1)) o vetor de dimensao q das respostas previas, entao adistribuicao condicional de Yit e dada por:

f(yit | hit) = exp

{

wi

φ

[

yitθit − b(θit)

]

+ c(yit, φ)

}

, (1)

em que wi sao os pesos a priori, φ um parametro de dispersao suposto conhecido, θit

representa o parametro canonico, b(θit) uma funcao que depende desse parametroe c(yit, φ) uma funcao que depende da variavel aleatoria Yit e do parametro dedispersao φ, seguindo as pressuposicoes de definicao de um MLG, a menos pelainclusao do ındice t, que considera as observacoes repetidas. Demonstra-se que:

µCit = E(Yit | hit) = b′(θit) e vC

it = V ar(Yit | hit) = b′′(θit)φ,

sao a media e variancia condicionais a hit.Considera-se, ainda, que a media e a variancia condicional satisfazem as

equacoes:

g(µCit) = ηit = x′

itβ +

s∑

r= 1

fr(hit; α) e vCit = v(µC

it)φ, (2)

em que g(µCit) e v(µC

it) denotam a funcao de ligacao e a funcao de variancia,respectivamente. Nota-se pela expressao (2), que a media condicional depende tantodas covariaveis como das respostas nas ocasioes anteriores. As respostas previasou funcoes delas mesmas sao tratadas como variaveis explicativas adicionais. Osparametros de interesse, a priori, pode ser representado pelo vetor δ = (β, α), emque β esta associado as covariaveis e α as respostas previas.

80 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 5: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

2.2.2 Estimacao dos parametros δ

Ao se especificar um modelo de transicao, nao se sabe, se o processo e, ounao, estacionario. Assim, a princıpio os modelos devem ser ajustados para ocaso nao estacionario. Para tanto, a proposta de Ware, Lipsitz e Speizer (1988),originariamente apresentada para dados categorizados ordinais, e ajustar um modelopara cada ocasiao como num estudo transversal. Os parametros de δ sao especıficospara cada ocasiao e sao obtidos maximizando as funcoes de verossimilhancas emseparado. Isso permite modelar as T transicoes possıveis, ou seja, de t = 0 parat = 1, de t = 1 para t = 2 e assim, sucessivamente, ate t = T − 1 a T . A cadeia deMarkov e caracterizada em cada modelo pela inclusao da resposta no tempo anteriorcomo uma covariavel independente em um modelo de regressao. Com variaveisordinais pode-se usar o modelo de chances proporcionais (McCULLAGH, 1980),que se reduz ao modelo de regressao logıstica para o caso de variaveis binarias.

Para o caso estacionario, Diggle et al. (2002) apresentam um processo deestimacao, que difere da proposta de Ware, Lipsitz e Speizer (1988), pois ajusta-seum unico modelo, a partir de uma soma de contribuicoes individuais (perfis derespostas) para a funcao de verossimilhanca. Assumindo um modelo de transicaode Markov de ordem q, a distribuicao condicional de Yit e expressa por:

f(yit | hit) = f(yit | yi(t−1), yi(t−2), . . . , yi(t−q)),

tal que a contribuicao na verossimilhanca do i-esimo indivıduo e dada por:

f(yi1, yi2, . . . , yiq)

ni∏

t=q+ 1

f(yit | yi(t−1), yi(t−2), . . . , yi(t−q)).

Na pratica, o modelo linear generalizado (1) define apenas a distribuicao condi-cional, portanto, a verossimilhanca das q primeiras observacoes f(yi1, yi2, . . . , yiq)nao e determinada diretamente, exceto para o caso da distribuicao normal.Consequentemente, a funcao de verossimilhanca total nao pode ser especificada.Uma alternativa, e estimar β e α maximizando a funcao de verossimilhancacondicional:

N∏

i=1

f(yi(q+ 1), . . . , yini| yi1, . . . , yiq) =

N∏

i=1

ni∏

t=q+ 1

f(yit | hit). (3)

Ha duas possibilidades distintas para se maximizar a funcao (3). Numaprimeira situacao, se fr(hit; α, β) = αrfr(hit), tal que g(µC

it) = x′

itβ+∑s

r=1 fr(hit)e uma funcao linear de ambos os parametros α e β, entao e possıvelproceder a estimacao dos parametros como se fosse um MLG para dadosindependentes, isto e, fazendo a regressao de Yit contra (p+s) variaveis explicativas(xit, f1(hit), . . . , fs(hit)).

De um modo geral, para uma variavel aleatoria seguindo o modelo (1), oalgoritmo proposto por Nelder e Wedderburn (1972) para o ajuste de modelos

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 81

Page 6: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

lineares generalizados permite obter estimativas de maxima verossimilhanca(metodo escore de Fisher) para δ no preditor linear η por mınimos quadradosponderados iterativamente.

Para tanto, considere Y i um vetor de respostas, com dimensoes (ni − q),para t = q + 1, . . . , ni e µC

i seu valor esperado condicionado a hit. Seja, tambem,

X∗

i uma matriz, com dimensoes (ni − q) × (p + s), cuja k-esima linha e∂ µi(q+k)

∂ δe W i = diag(1/ vC

i(k+q)), com k = (1, . . . , (ni − q)), a matriz de ponderacao, de

dimensoes (ni − q)× (ni − q). Por fim, seja Zi = X∗

i δ + (Y i − µCi ). Entao, o valor

atualizado δ pode ser obtido iterativamente pela regressao de Z contra X∗ usandoa matriz de pesos W , isto e:

δ(m+1)

=

( N∑

i=1

X∗′

i W(m)i X∗

i

)

−1( N∑

i=1

X∗′

i W(m)i Z

(m)i

)

.

Um segundo caso para a estimacao dos parametros de um modelo de transicaopode ocorrer quando as funcoes das respostas previas, fr, incluem ambos osparametros α e β. Um exemplo dessa situacao e dado em Zeger e Q aqish (1988), emque a modelagem de dados de contagem e feita a partir de um modelo de transicaode Markov estacionario de primeira ordem, com f = α[log(yi(t−1) − x′

i(t−1)β],caracterizando, portanto, um preditor nao linear. Nesse caso, pode ser necessariousar metodos para modelos nao lineares. Situacoes como essa, nao sao consideradasneste trabalho.

2.2.3 Matriz das prob ab ilidades de transicao da cadeia de Mark ov para

dados b inarios

A estimacao das probabilidades, P [Yit = yit | hit, xit], pode ser feita atravesde ηit = g(µC

it), sendo g(.) uma funcao adequada que faz a ligacao entre aparte aleatoria e a parte sistematica (respostas previas, efeitos de tratamentos ecovariaveis). A distribuicao condicional de Yit, para t = 2, 3, . . . , ni segue um modelolinear generalizado de transicao, ou seja,

f(yit | hit) = exp

{

yit ln

(

µCit

1 − µCit

)

+ ln(1 − µCit)

}

, (i = 1, 2, . . . , N )

para o qual:

g(µcit) = logito(µc

it) = ln

(

µcit

1 − µcit

)

e v(µcit) = µc

it(1 − µcit),

sao, respectivamente, as funcoes de ligacao e de variancia do modelo. Para o casoem que a ordem da cadeia e 1, tem-se como preditor linear:

ηit = logito [P (Yit = b | Yi(t−1) = a)] = ln

(

πab(t)

1 − πab(t)

)

= x′

itβ + αyi(t−1). (4)

82 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 7: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

A caracterizacao das matrizes de probabilidades de transicao, 2× 2, com elementosπab(t) = P (Yit = b | Yi(t−1) = a), em que a e b assumem valores em S = {0, 1},pode ser feita a partir da equacao definida em (4), por meio de:

πab(t) =exp(ηit)

1 + exp(ηit),

avaliando-se ηit primeiramente com relacao a Yi(t−1) = 0 e, posteriormente aYi(t−1) = 1. Logo:

P (t) =

π00(t) =1

1 + exp(x′

itβ)π01(t) =

exp(x′

itβ)

1 + exp(x′

itβ)

π10(t) =1

1 + exp(x′

itβ + α)π11(t) =

exp(x′

itβ + α)

1 + exp(x′

itβ + α)

,

em que π00(t) = 1 − π01(t) e π10(t) = 1 − π11(t).Note que para especificar a matriz de probabilidades de transicao, avaliam-se

duas regressoes separadamente. Diggle et al. (2002) mostram que uma forma maisconcisa e dada por:

ηit = logito [P (Yit | Yi(t−1))] = ln

(

πab(t)

1 − πab(t)

)

= x′

itβ + yi(t−1)x′

itα, (5)

sendo a equacao (4) um caso particular da equacao (5), que inclui todas as interacoesentre a resposta previa e as covariaveis, resultando em vantagens em termos deinferencia.

Os resultados apresentados partem da pressuposicao de que a funcao de ligacaoadequada e a logito. Para os casos em que essa funcao nao seja satisfatoria, pode-seoptar por outras funcoes de ligacao, como probito e complemento log-log. Umaextensao para um modelo de ordem q tem como preditor linear:

ηit = g[P (Yit = b | hit)] = x′

itβ +

q∑

r=1

αryi(t−r)xit,

sendo a cadeia de ordem 1, isto e fr(hit, α) = αryi(t−r)xit com s = q = 1, umcaso especıfico. Em particular, uma cadeia de Markov de alcance 2, com funcao deligacao canonica tem como preditor linear:

ηit = logito [P (Yit = c | Yi(t−2) = b, Yi(t−1) = a)]

= x′

itβ + yi(t−1)xitα1 + yi(t−2)xitα2 + yi(t−1)yi(t−2)xitα3, (6)

com a, b, c ∈ S = {0, 1}. Assim, considerando o preditor linear (6) e todas ascombinacoes para hit = (yi(t−2), yi(t−1)), e possıvel especificar a seguinte matriz detransicao de segunda ordem:

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 83

Page 8: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

P (t) =

π000(t) = 1 − π001(t) π001(t) =ex p (x′

itβ)

1 + ex p (x′

itβ)

π010(t) = 1 − π011(t) π011(t) =ex p (x′

itβ + xitα1)

1 + ex p (x′

itβ + xitα1)

π100(t) = 1 − π101(t) π101(t) =ex p (x′

itβ + xitα2)

1 + ex p (x′

itβ + xitα2)

π110(t) = 1 − π111(t) π111(t) =ex p (x′

itβ + xitα1 + xitα2 + xitα3)

1 + ex p (x′

itβ + xitα1 + xitα2 + xitα3)

.

Deve ser observado que como a matriz de probabilidades de transicaodepende das variaveis ex plicativas, P (t) pode variar entre os indivıduos e, cadeiasde alcance maior podem se tornar ex tremamente complex as, em virtude donumero de parametros envolvidos no processo de estimacao. A condicao deestacionariedade do processo, para uma cadeia de alcance 1 , tem como h ipoteseprincipal, H0 : πab(t) = πab, ou em termos matriciais, H0 : P (t) = P para todot ∈ τ . G ood (1 9 5 5 ), A nderson e G oodman (1 9 5 7 ) sug erem dois criterios para setestar essa h ipotese, sendo um deles o de qui-quadrado, com estatıstica:

ξ =∑

t

a

b

na(t − 1 )[πab(t) − πab]2

πab

, (7 )

em que na(t − 1 ) =∑

b nab(t) e nab(t) sao as frequencias de transicoes observadas,πab e πab(t) sao os estimadores das probabilidades de transicao, sob H 0 e sob H a,respectivamente.

O utro procedimento e usar o criterio da razao de verossimilh ancas. A s funcoesde verossimilh anca max imizadas, sob as h ipoteses nula e alterantiva, sao:

L(P ) =

T∏

t= 1

a,b

πnab(t)ab e L(P (t)) =

T∏

t= 1

a,b

πab(t)nab(t),

respectivamente. P ortanto:

Λ =L(P )

L(P (t))=

T∏

t= 1

a,b

[

πab

πab(t)

]nab(t)

,

e como ex tensao do teorema de N ey man-P earson, tem-se a seg uinte estatıstica:

λ = −2∑

t

a

b

nab(t) log

(

πab

πab(t)

)

, (8 )

sendo que, sob H 0 as estatısticas (7 ) e (8 ) sao equivalentes e assintoticamenteconverg em para uma distribuicao χ2 com 2(T − 1 ) g raus de liberdade.

84 Rev. B ra s. B io m ., S a o P a u lo , v .2 5 , n .4, p .7 7 -1 0 0 , 2 0 0 7

Page 9: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Anderson e Goodman (1957) tambem apresentam testes para se verificaralcance da cadeia. Assim como nos procedimentos anteriores, os testes necessitamque sejam estimadas as probabilidades de transicao. U ma alternativa, para o casoem que ha variaveis explicativas e construir o teste da razao de verossimilhancas,sob os logaritmos das funcoes de verossimilhancas dos modelos de transicao. Ahipotese nula de interesse e:

H0: A cadeia e de (q − 1)-esima ordem;

contra a alternativa de que a cadeia e de q-esima ordem. S ejam `(β, α , y )(q−1)

e `(β, α , y )(q) os logaritmos das funcoes de verossimilhanca maximizadas sob ascondicoes de ordem (q − 1) e q, respectivamente. Assim, para a situacao maiselementar, isto e, a menos de interacoes entre a resposta previa e demais covariaveis,a estatıstica para o teste da razao de verossimilhancas e:

λ = 2(`(β, α , y )(q) − `(β, α , y )(q−1)) ∼ χ21,

sendo necessario o mesmo numero de observacoes para os ajustes nos dois casos.Assim, para o modelo de menor alcance, as q primeiras observacoes devem seromitidas. Q uanto aos procedimentos computacionais, softwares padroes podemser utilizados para o ajuste desses modelos, como os procedimentos logistic egen m od do S AS (S AS Institute Inc, 1999) ou os pacotes, glm , gee e geepack

do R (R Development C ore T eam, 2007). Para o caso estacionario, necessita-seorganizar o conjunto de dados de tal forma a incorporar as respostas previas comocovariaveis extras, ignorando as observacoes referentes a ordem da cadeia. Paraesses casos, usa-se a macro D R O P O U T , proposta por M olenberghs e V erbek e (2005),desenvolvida no programa S AS .

2 .2 .4 T e ste s p a ra c o m p a ra c a o d e tra ta m e n to s

Q uando se tem um experimento ou estudo envolvendo tratamentos e objetivobasico avaliar qual tratamento e o mais eficiente do ponto vista pratico. Asprobabilidades de transicao podem ser usadas na construcao de testes que auxiliema tomada de decisao. C onsidere a situacao do estudo epidemiologico, em que osestratos placebo e ativo sao amostras independentes. Para um estado previo a,com a ∈ S = {0, 1}, as probabilidades de transicao podem ser descritas comoapresentado na T abela 1.

Para Y(t−1) = 0, as hipoteses de interesse podem ser formuladas em termos detransicoes, considerando permanencia no estado 0 (π00) ou mudancas para o estado1 (π01). S e “ 0” denota estado de saude ruim e “ 1” estado de saude bom, do pontode vista pratico, parece sensato formular as hipoteses:

Hipoteses(1) : mudancas para o estado 1

{

H0 : π01(A) − π01(P) = 0;Ha : π01(A) − π01(P) > 0.

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 85

Page 10: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Tabela 1 - Distribuicao das probabilidades de transicao, considerando os gruposplacebo e ativo (tratamento), com estado previo fixado Y(t−1) = a, nummodelo de Markov

Yit

Tratamentos 0 1Placebo (P) πa0(P ) πa1(P )Ativo (A) πa0(A) πa1(A)

No entanto, ha outras formulacoes possıveis e equivalentes. Por outro lado,quando se trabalha com respostas binarias, um dos anseios do pesquisador efazer inferencias com relacao a razao de chances, principalmente se o estudo eretrospectivo. Com base na Tabela 1, a razao de chances associada a Y(t−1) = a edada por:

ψY(t−1)=a =πa0(P ) × πa1(A)

πa0(A) × πa1(P ),

se n d o q u e q u a n d o ψ > 1, in d ic a q u e o s in d iv ıd u o s d o g ru p o p la c e b o e sta om a is p ro p e n so s a tra n sic a o p a ra o e sta d o 0 d o q u e o s in d iv ıd u o s d o g ru p o a tiv o(πa0(P ) > πa0(A)) o u e q u iv a le n te m e n te q u e o s in d iv ıd u o s d o g ru p o a tiv o e sta om a is p ro p e n so s a tra n sic a o p a ra o e sta d o 1 d o q u e o s in d iv ıd u o s d o g ru p o p la c e b o(πa1(A) > πa1(P )). D ia n te d e ssa e x p la n a c a o , e ra z o a v e l ta m b e m fo rm u la r a sse g u in te s h ip o te se s:

Hip o te se s(2 ) : e m te rm o s d e ra z a o d e ch a n c e s

{

H0 : ψ = 1;Ha : ψ > 1.

C o m o e m u m a c a d e ia d e M a rk o v h a d e se c o n sid e ra re m o s e sta d o s p re v io s,u m a p ra tic a in ic ia l e v e rifi c a r se h a h o m o g e n e id a d e d a ra z a o d e ch a n c e s e m re la c a oa s re p o sta s p re v ia s, q u e d e fi n e m a o rd e m d a c a d e ia . A ssim e m u m a c a d e ia d e o rd e m1, a h ip o te se d e h o m o g e n e id a d e e :

H0 : ψY(t−1)= 0= ψY(t−1)= 1

. (9 )

C o n sid e ra n d o o m o d e lo e sto c a stic o :

η = ln

(

πab

1 − πab

)

= β0 + β1tra ta m e n to + α y(t−1) + γ(y(t−1)) ∗ tra ta m e n to , (10 )

a ra z a o d e ch a n c e s a sso c ia d a a s re sp o sta s p re v ia s p o d e m se r o b tid a s e m te rm o s d o sc o e fi c ie n te s d e sse m o d e lo , d e m o d o q u e o te ste d a h ip o te se (9 ) e q u iv a le a o te steH0 : γ = 0 p e lo m o d e lo d e fi n id o e m (10 ). E sse te ste p o d e se r fe ito p e la ra z a od e v e ro ssim ilh a n c a s o u p e la d ife re n c a d e deviances, c o n sid e ra n d o -se o s m o d e lo se n c a ix a d o s se m e c o m in te ra c a o . U m a e x te n sa o p a ra u m m o d e lo d e M a rk o v d ea lc a n c e q, te ria c o m o h ip o te se n a tu ra l p a ra a h o m o g e n e id a d e d e ra z a o d e ch a n c e s,

86 Rev. B ra s. B io m ., S a o P a u lo , v .2 5 , n .4 , p .7 7 -1 0 0 , 2 0 0 7

Page 11: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

H0 : γ = 0, sendo γ o vetor de parametros de todas as interacoes do tratamentocom as respostas previas. P ortanto, a ausencia de interacao entre as respostasprevias e tratamento significa que a associacao entre a resposta no tempo t e o tipode tratamento (covariavel) e independente da historia da cadeia. Contudo, sendoo modelo de transicao de Markov, deve haver efeito de ht sob as probabilidadesde transicao. L ogo, essas probabilidades podem estar em patamares diferentes deacordo com o tratamento recebido e estado na ocasiao (t − 1) ou em sua historia,(ht), se a cadeia e de alcance maior do que 1. F az-se necessario, entao, um testepara comparar os tratamentos.

T e ste d a ra z a o d e ch a n c e s

N o contexto da analise de dados categorizados, e conhecida a estatıstica deMantel e Haenszel (195 9), que avalia a nao existencia de associacao entre as linhas(independentes) e as colunas em tabelas de contingencia 2 × 2 , mantendo-se o efeitoda estratificacao em relacao a um terceiro fator (AG R ES T I, 1991 e P AUL A, 2 004 ).A ideia basica do teste, que tem como hipotese principal H0 : ψ = 1, e a distribuicaonormal assintotica de uma distribuicao condicional.

Considere a T abela 2 , em que sao amostrados n1 e n2 indivıduos nos estratosA e B, com y1 e y2 respostas favoraveis a primeira categoria, respectivamente.

T abela 2 - Estrutura usual de uma tabela de contingencia 2 × 2 para o teste deManthel-Haenszel

R espostaEstratos 1 2 T otal marginalA y1 n1 − y1 n1

B y2 n2 − y2 n2

T otal marginal m n − m n

S ob essa estrutura, a distribuicao condicional (y1 | m, ψ) produz um modelopertencente a famılia de distribuicoes hipergeometricas nao centrais. Em particular,para ψ = 1, esse modelo reduz-se a distribuicao hipergeometrica central:

f(y1 | m, ψ = 1) =

(

n1

y1

)(

n2

y2

)

(

n1 + n2

m

) , (11)

com media e variancia dadas por:

E(Y1 | m, ψ = 1) =mn1

ne V ar(Y1 | m, ψ = 1) =

n1n2m(n − m)

n2(n − 1).

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 87

Page 12: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Quando n1, n2, m e n − m sao suficientemente grandes, a distribuicao (11)tende a distribuicao normal e consequentemente:

Z =y1 −

mn1

n√

n1n2m(n−m)n3

∼ N(0, 1), (12)

e uma estatıstica apropriada para avaliar a hipotese de que ψ = 1. No caso dosmodelos de transicao, se ha homogeneidade da razao de chances em relacao ahistoria do processo, entao e possıvel adaptar a estatıstica do teste de Mantel eHaenszel (1959), para confrontar as hipoteses(3) H0 : ψ = 1 e Ha : ψ > 1. Paraum processo estacionario de primeira ordem e possıvel descrever as frequencias detransicoes atraves de duas tabelas de contingencia 2 × 2, uma para cada tipo deresposta previa, que tem aspecto similar a Tabela 2.

Na Tabela 3 , n∗

a0(j)(.) e n∗

a1(j)(.) denotam as frequencias totais de transicoes

do estado a para os estados 0 e 1, respectivamente. O ındice (j) e incluıdo paradiferenciar as frequencias de transicoes em relacao a historia da cadeia. Usandoo resultado (12) do teste de Mantel-Haenszel, tem-se assintoticamente a seguinteestatıstica para teste:

ZM H =

∑2j=1 n∗

a0(j)(P ) −

∑2j=1 (E)j

∑2j=1 (Var)j

∼ N(0, 1),

em que (E)j =n∗

.0(j)n∗

a.(j)(P )

n∗..(j)e (Var)j =

n∗

a.(j)(P )n∗

a.(j)(A)n∗

.0(j)(n∗..(j) − n∗

.0(j))

(n∗..(j))3.

Tabela 3 - Tabela de contingencia 2 × 2, considerando os estratos de tratamentoe as frequencias de transicoes para os estados 0 e 1, dado Y(t−1) = a,a ∈ {0, 1}

Yt

Tratamento 0 1 Total marginalPlacebo n∗

a0(j)(P ) n∗

a1(j)(P ) n∗

a.(j)(P )

Ativo n∗

a0(j)(A) n∗

a1(j)(A) n∗

a.(j)(A)

Total marginal n∗

.0(j)n∗

.1(j)n∗..(j)

Assim para Ha : ψ > 1, o nıvel descritivo do teste e dado por

p∗ = P (Z > ZM H ),

constituindo-se num criterio para discriminar entre os dois tratamentos. O testese aplica, naturalmente, para cadeias de alcance maior do que 1. Nesses casos, ascaselas da Tabela 3 denotam as frequencias de transicoes de hit para os estadosS = {0, 1}.

88 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 13: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Teste da diferenca das probabilidades de transicao

Sem perda de generalidade, considere as hipoteses que avaliam as mudancasdo estado 0 para o estado 1. Um teste pode ser especificado para avaliar essashipoteses, num procedimento fundamentado na teoria assintotica com respeito adistribuicao dos estimadores das probabilidades de transicao, de modo analogo aideia que se tem na comparacao de duas proporcoes. Como as probabilidades detransicao satisfazem a equacao de Chapman-K olmogorov, elas podem ser reescritasem termos de funcoes de transicao em r = (s+v) passos. Essas funcoes parecem sermais indicadas para avaliar o que ocorre com o indivıduo, considerando o inıcio doestudo, as transicoes e seu estado ao final do estudo. Ademais, para o caso em queas probabilidades de transicao sao estacionarias, a funcao de transicao em r etapas,por Chapman-K olmogorov e:

π(r)01 =

k∈S

π(s)0k π

(v)k1 .

Logo, podem-se formular as hipoteses:

Hipoteses(1∗) : mudancas para o estado 1 em r passos

{

H0 : π(r)01 (A) − π

(r)01 (P) = 0

Ha : π(r)01 (A) − π

(r)01 (P) > 0.

Para estabelecer a estatıstica do teste, parte-se do resultado sobre adistribuicao amostral do estimador de maxima verossimilhanca das probabilidadesde transicao, πab, descrito em Anderson e Goodman (1957 ). Quando n → ∞ ,tem-se:

√nςa(πab − πab) → N(0, πab(1 − πab)),

em que ςa =∑k

j=1

∑T

t=1nj(0)

[t−1]ja . Assim, para os grupos de tratamentos, tem-se

assintoticamente que:

π(r)01 (A) ∼ N

[

π(r)01 (A),

π(r)01 (A)[1 − π

(r)01 (A)]

n(A)ςa(A)

]

e

π(r)01 (P ) ∼ N

[

π(r)01 (P ),

π(r)01 (P )[1 − π

(r)01 (P )]

n(P )ςa(P )

]

.

Como ha independencia entre os tratamentos, a diferenca entre as estatısticas

π(r)01 (A) − π

(r)01 (P ), quando n(A) → ∞ e n(P ) → ∞ , tambem tem como limite uma

distribuicao normal, isto e,

π(r)01 (A) − π

(r)01 (P ) ∼ N(πD, σ2

D),

em que πD = π(r)01 (A)−π

(r)01 (P ) e σ2

D =π

(r)01 (A)[1 − π

(r)01 (A)]

n(A)ςa(A)+

π(r)01 (P )[1 − π

(r)01 (P )]

n(P )ςa(P ).

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 89

Page 14: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Desse modo, sob H0 e considerando teste unilateral a direita, o nıvel descritivoe dado por:

p∗ = P

(

Z >πD

σD

)

.

3 Resultados e discussao

Para ilustrar as diferentes formas de se trabalhar com modelos de transicaode Markov, a princıpio, realiza-se uma analise considerando o efeito de tratamento.Na Tabela 4, sao apresentadas as frequencias de transicao para os estados ruim (0)e bom (1), estratificada por tratamento.

Tabela 4 - Distribuicao das transicoes de acordo com o tipo de tratamento no estudoepidemiologico sobre a condicao respiratoria

Yit

Tratamento 0 1Placebo 127 101 228

(0,5570) (0,4430)

Ativo 6 9 147 216(0,3194) (0,6 8 06 )

444

Nota-se que ha indicativo de infl uencia do tratamento sob a condicaorespiratoria do indivıduo. A estimativa de transicao para o estado bom e 1,53vezes maior para pacientes do grupo ativo. Entretanto, ha nitidamente uma fortecorrelacao entre as observacoes nos tempos t e (t−1), conforme mostram as Tabelas5 e 6 . Analisando, separadamente, a infl uencia do tratamento dadas as respostasprevias, percebe-se que apesar do indicativo do efeito da droga ativa, ha uma maiorprobabilidade de transicao para estado bom, se a condicao previa e boa.

Ainda na Tabela 5, percebe-se que as probabilidades de transicoes para oestado bom, do grupo com tratamento ativo sao maiores do que as do grupo placebo,enquanto que as probabilidades de transicao para o estado ruim sao maiores para ogrupo placebo (exceto na ultima transicao). O fato de as probabilidades, π01 e π11

serem decrescentes no grupo com tratamento ativo pode ser decorrencia da perdado efeito do tratamento. Sob a hipotese de estacionariedade, (Tabela 6 ), dado queo paciente esta bom na ocasiao (t − 1), a probabilidade de transicao para o estadobom e cerca de 3,56 vezes maior para o grupo placebo e 2,29 vezes maior para ogrupo com tratamento ativo, quando comparadas a condicao previa ruim.

Pela definicao de modelos lineares generalizados de transicao, os resultadosapresentados nas Tabelas 5 e 6 sao reproduzidos (estimados), a partir das

90 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 15: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Tabela 5 - Numero de transicoes e estimativas de probabilidades, de acordo com otipo de tratamento e condicao respiratoria na visita anterior

Primeira transicao

(Yi(t−1) = 0) (Yi(t−1) = 1 )T ra ta m e n to Yit = 0 Yit = 1 T o ta l Yit = 0 Yit = 1 T o ta l

P la c e b o 2 2 9 3 1 7 1 9 2 6(0,7 09 7 ) (0,2 9 03 ) (0,2 6 9 2 ) (0,7 3 08 )

A tiv o 1 7 1 3 3 0 0 2 4 2 4(0,5 6 6 7 ) (0,4 3 3 3 ) (0,0000) (1 ,0000)

6 1 5 0

S e g u n d a tra n sic a o

(Yi(t−1) = 0) (Yi(t−1) = 1 )T ra ta m e n to Yit = 0 Yit = 1 T o ta l Yit = 0 Yit = 1 T o ta l

P la c e b o 2 5 4 2 9 1 0 1 8 2 8(0,8 6 2 1 ) (0,1 3 7 9 ) (0,3 5 7 1 ) (0,6 4 2 9 )

A tiv o 1 0 7 1 7 6 3 1 3 7(0,5 8 8 2 ) (0,4 1 1 8 ) (0,1 6 2 2 ) (0,8 3 7 8 )

4 6 6 5

T e rc e ira tra n sic a o

(Yi(t−1) = 0) (Yi(t−1) = 1 )T ra ta m e n to Yit = 0 Yit = 1 T o ta l Yit = 0 Yit = 1 T o ta l

P la c e b o 2 6 9 3 5 5 1 7 2 2(0,7 4 2 9 ) (0,2 5 7 1 ) (0,2 2 7 3 ) (0,7 7 2 7 )

A tiv o 1 1 5 1 6 4 3 4 3 8(0,6 8 7 5 ) (0,3 1 2 5 ) (0,1 05 3 ) (0,8 9 4 7 )

5 1 6 0

Q u a rta tra n sic a o

(Yi(t−1) = 0) (Yi(t−1) = 1 )T ra ta m e n to Yit = 0 Yit = 1 T o ta l Yit = 0 Yit = 1 T o ta l

P la c e b o 2 7 4 3 1 5 2 1 2 6(0,8 7 1 0) (0,1 2 9 0) (0,1 9 2 3 ) (0,8 07 7 )

A tiv o 1 1 4 1 5 1 0 2 9 3 9(0,7 3 3 3 ) (0,2 6 6 7 ) (0,2 5 6 4 ) (0,7 4 3 6 )

4 6 6 5

estimativas dos parametros do modelo, especificado pelo preditor linear (10). Osresu ltados apresentados na T ab ela 6 sao reprodu z idos a partir do modelo aju stadopara a totalidade das transicoes.

N a T ab ela 7 , sao apresentadas as estimativas dos parametros para os q u atromodelos de transicao de primeira ordem, considerando os efeitos de tratamento einteracao com a resposta no tempo anterior, enq u anto q u e na T ab ela 8 , apresentam-se as estimativas desses parametros para o processo estacionario. R essalta-se asig nificancia estatıstica (p < 0, 01), para as respostas no tempo (t− 1).

P ara estimar as prob ab ilidades u sam-se essas estimativas. P or ex emplo,

Rev. B ra s. B io m ., S a o P a u lo , v .2 5 , n .4 , p .7 7 -1 0 0 , 2 0 0 7 9 1

Page 16: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Tabela 6 - Total de transicoes e estimativas de probabilidades, de acordo com o tipode tratamento e condicao respiratoria na visita anterior

(Yi(t−1 ) = 0) (Yi(t−1 ) = 1)Tratamento Yit = 0 Yit = 1 Yit = 0 Yit = 1

Placebo 100 2 6 12 6 2 7 75 102(0,79 37) (0,2 063) (0,2 64 7) (0,735 3)

A tivo 4 9 2 9 78 2 0 118 138(0,62 82 ) (0,3718) (0,14 4 9 ) (0,85 5 1)

Tabela 7 - E stimativas dos parametros para os modelos de transicao de 1a ordem,considerando efeitos de tratamento e interacao tratamento e respostaprevia, no estudo sobre a condicao respiratoria

1a transicao 2 a transicaoParametros E stimativas valor p E stimativas valor pintercepto -0,89 38 0,02 39 -1,832 6 < 0, 01tratamento ativo 0,62 5 6 0,2 4 73 1,4 75 9 0,04 32resposta previa (Yi(t−1 )) 1,89 2 3 < 0, 01 2 ,4 2 04 < 0, 01tratamento* Yi(t−1 ) 2 4 ,74 12 0,9 9 9 8 -0,4 2 15 0,65 4 6

3a transicao 4 a transicaoParametros E stimativas valor p E stimativas valor pintercepto -1,0609 < 0, 01 -1,9 09 5 < 0, 01tratamento ativo 0,2 72 4 0,6815 0,89 79 0,2 5 72resposta previa (Yi(t−1 ) 2 ,2 84 6 < 0, 01 3,34 4 6 < 0, 01tratamento* Yi(t−1 ) 0,64 39 0,5 15 2 -1,2 683 0,2 070

Tabela 8 - E stimativas dos parametros para o modelo de transicao estacionario de1a ordem, considerando efeitos de tratamento e interacao tratamento eresposta previa, no estudo sobre a condicao respiratoria

Parametros E stimativa E rro-padrao valor pintercepto −1, 34 71 0,2 2 01 < 0, 01tratamento ativo 0,82 2 5 0,32 15 0,010resposta previa (Yi(t−1 )) 2 ,3687 0,314 4 < 0, 01tratamento ∗ Yi(t−1 ) −0, 069 2 0,4 606 0,880

sob estacionariedade, (Tabela 8), para os pacientes com tratamento ativo, aprobabilidade de mudanca do estado ruim para o estado bom e estimada por

92 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 17: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

π01 = e x p (−1,3 4 7 1+ 0,8 225 )1+ e x p (−1,3 4 7 1+ 0,8 225 ) = 0, 3718, enquanto que para o grupo placebo, essa

probabilidade e dada por π01 = e x p (−1,3 4 7 1)1+ e x p (−1,3 4 7 1) = 0, 2063. Assim, e possıvel estimar

todas as probabilidades de transicao, que sao consideradas independentes do tempo.Essa pressuposicao, e ainda confirmada aplicando-se o teste da h omogeneidadeno tempo (ou estacionariedade) para as matrizes de probabilidades de transicaoem cada um dos grupos ativo e placebo, estimadas a partir dos modelos detransicao marginais. As estatısticas pelo teste de qui-quadrado sao ξ = 9, 62,para o grupo ativo e ξ = 5, 93, para o grupo placebo, sendo que comparadasao valor χ2

6 ; 0,01 = 16, 81, mostram evidencia de que o processo e estacionario.M atricialmente, tem-se

P (ativ o ) =

(

0, 6282 0, 37180, 1449 0, 8551

)

e P (p lac e b o ) =

(

0, 7937 0, 20630, 2647 0, 7353

)

.

A partir dessas matrizes, pode-se tambem observar que, para ospacientes com estado de saude ruim na visita anterior (linh as superiores das

matrizes P (ativ o ) e P (p lac e b o )), o logaritmo da razao de ch ances, isto e,ln[(0, 3718/0, 6282)/(0, 2063/0, 7937)] = 0, 82, e a estimativa do coeficiente doefeito de tratamento. Para os pacientes cuja condicao de saude e boa naocasiao (t − 1) (linh as inferiores das matrizes P (ativ o ) e P (p lac e b o )), tem-se queln[(0, 8551/0, 1449)/(0, 7353/0, 2647)] = 0, 75 e a soma dos coeficientes referentesao efeito de tratamento mais a interacao de tratamento e resposta previa. A razaode ch ances, exp(0, 82) = 2, 27 indica que se a condicao previa e ruim, os indivıduosdo grupo placebo tem 2,27 vezes maior ch ance de permanencia nesse estado, aopasso que se a condicao previa e boa essa ch ance cai para 2,11. Na Tabela 9, saoapresentadas as estimativas dos parametros para o modelo estacionario de primeiraordem, considerando as demais covariaveis do estudo.

O modelo 1 e ajustado considerando os efeitos do centro clınico, sexo, idade,tratamento e condicao de saude na ocasiao (t − 1). Os efeitos de centro clınico,tratamento, e resposta previa sao significativos (p < 0, 01). No modelo 2,adicionalmente, sao considerados os efeitos das interacoes da resposta previa comessas covariaveis, alem do fator ocasiao (visita). Nenh uma dessas interacoes esignificativa. Q uando nao h a interacao, entre a h istoria do processo e as covariaveis,h a um indicativo de que as respostas previas afetam a probabilidade de transicao,mas os efeitos das covariaveis sob elas sao os mesmos, independente da h istoria.D esse modo, considerando os efeitos significativos do modelo 1, sao estimadas asprobabilidades de transicao, atraves da funcao:

πa1 =exp(−0, 3248 − 0, 7622(centro) + 0, 8382(tratamento) + 2, 2277Yi(t−1))

1 + exp(−0, 3248 − 0, 7622(centro) + 0, 8382(tratamento) + 2, 2277Yi(t−1)),

com πa0 = 1 − πa1, a ∈ S = {0, 1}. As matrizes de probabilidades de transicaoconsiderando esses efeitos, para os respectivos grupos ativo e placebo, sao:

P (ativ o ) =

(

0, 5618 0, 43820, 1214 0, 8786

)

e P (p lac e b o ) =

(

0, 7478 0, 25220, 2422 0, 7578

)

.

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 93

Page 18: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Tabela 9 - Estimativas dos parametros fixos e respectivos erros-padrao, para doismodelos de transicao estacionarios de primeira ordem, no estudo sobrea condicao respiratoria

Modelo 1 Modelo 2Parametros Estimativa Erro-padrao Estimativa Erro-padraointercepto −0, 3248 0,4104 1,1776 0,7930centro 1 −0, 7622 0,2477 −0, 9852 0,3548sexo (feminino) 0, 0506 0,3111 0,1891 0,4486tratamento (ativo) 0, 8382 0,2413 0, 8040 0,3566idade −0, 0177 0,0093 −0, 0365 0,0158visita −0, 2345 0,1509Yit−1 2, 2277 0,2337 0,6575 1,0858centro ∗ Yi(t−1) 0,4652 0,4988sexo ∗ Yi(t−1) −0, 2228 0,6350tratamento ∗ Yi(t−1) −0, 0182 0,4937idade ∗ Yi(t−1) 0,0320 0,0200visita ∗ Yi(t−1) 0,1116 0,2144

U sando os resultados das probabilidades de transicao dessas matrizes, pode-seefetuar o teste para a diferenca das probabilidades considerado sob a hipotese demudancas para o estado bom, em 4 passos. As probabilidades necessarias paraaplicacao do teste sao obtidas pela equacao de C hapman-K olmogorov, ou seja,

P(4)

(ativo) =

(

0, 2464 0, 75360, 2088 0, 7911

)

e P(4)

(placebo) =

(

0, 5232 0, 47680, 4578 0, 5422

)

.

A diferenca observada entre as probabilidades e π(4)01 (A) − π

(4)01 (P) = 0, 2768,

com erro-padrao estimado em 0, 1527, levando a estatıstica Z = 1, 81, (nıveldescritivo =0,036). O resultado ratifica a evidencia de diferenca significativa afavor da grupo tratado. Adicionalmente, em se tratando de modelos de transicao,e importante considerar tambem a possibilidade de alcance da cadeia maior do que1.

Dando prosseguimento a analise, na Tabela 10 sao apresentadas as frequenciasde transicoes de segunda ordem, as quais permitem explorar a necessidade de seconsiderar a cadeia de Mark ov de ordem 2, bem como verificar sua estacionariedade.

A partir da Tabela 10, especificam-se as frequencias sob a hipotese deestacionariedade, conforme mostra a Tabela 11 e, portanto, obtem-se a estatısticapara estacionariedade:

ξ =39(0, 7949 − 0, 8288)2

0, 8288+ . . . +

51(0, 1765 − 0, 1748)2

0, 1748= 4, 59.

94 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 19: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Tabela 10 - Frequencias de transicoes de segunda ordem observadas no estudo sobrea condicao respiratoria

Primeira transicao Segunda transicao Terceira transicaoht Yi t = 0 Yi t = 1 Total Yi t = 0 Yi t = 1 Total Yi t = 0 Yi t = 1 Total00 31 8 39 28 7 35 33 4 37

(0,79 49 ) (0,2051) (0,8000) (0,2000) (0,89 19 ) (0,1081)01 6 16 22 3 8 11 6 8 14

(0,2727) (0,7273) (0,2727) (0,7273) (0,4286) (0,5714)10 4 3 7 9 7 16 5 4 9

(0,5714) (0,4286) (0,5625) (0,4375) (0,5556) (0,4444)11 10 33 43 6 43 49 9 42 51

(0,2326) (0,7674) (0,1224) (0,8776) (0,1765) (0,8235)

Tabela 11 - Total de frequencias de transicoes de segunda ordem observadas noestudo sobre a condicao respiratoria

ht Yit = 0 Yit = 1 Total00 92 19 111

(0,8288) (0,1712)01 15 32 47

(0,3191) (0,6809)10 18 14 32

(0,5625) (0,44375)11 25 118 143

(0,1748) (0,8252)

S endo χ28,(0,01) = 20, 09, tem-se que mesmo para o processo de ordem 2, nao se

rejeitaria a hipotese de estacionariedade. Pelo criterio da razao de verossimilhancas,a estatıstica obtida e λ = 2, 03. Por outro lado, podem-se, tambem, aplicar testespara se verificar a ordem da cadeia, ou seja, avaliar as hipoteses

H0: A cadeia e de ordem 1 (πabc = πbc);Ha: A cadeia e de ordem 2 (πabc 6= πbc),

com a, b, c ∈ S = {0, 1}. Da Tabela 10, tambem podem ser estimadas as frequenciasde primeira ordem, sob H0, como mostra a Tabela 12.

Assim, as estimativas da Tabela 11 podem ser comparadas as frequencias daTabela 12, fixando-se Yi(t−1) = 0 e, posteriormente Yi(t−1) = 1. Pelo criterio dequi-quadrado, tem-se:

ξ =111(0, 8288 − 0, 7692)2

0, 7692+ . . . +

143(0, 8252 − 0, 7895)2

0, 7895= 14, 35,

sendo signficativo, uma vez que χ22,(0,01) = 9, 21 (nıvel descritivo = 0,00076). O

criterio da razao de verossimilhancas leva a estatıstica λ = 13, 17 (nıvel descritivo= 0,0013).

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 95

Page 20: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Tabela 12 - Total de frequencias de transicoes de primeira ordem observadas noestudo sobre a condicao respiratoria, considerando 333 observacoes

ht Yit = 0 Yit = 1 TotalYi(t−1) = 0 110 33 143

(0,7692) (0,2308)Yi(t−1) = 1 40 150 190

(0,2105) (0,7895)

Os resultados dessa analise exploratoria preliminar indicam que e razoavelconsiderar para esse caso um modelo estocastico estacionario de ordem 2. Assim,considerando as demais variaveis explicativas do estudo, sao apresentadas naTabela 13 as estimativas para os parametros do modelo de 2a ordem.

Tabela 13 - Estimativas dos parametros e respectivos erros-padrao para o modelo detransicao estacionarios de segunda ordem, no estudo sobre a condicaorespiratoria

Parametros Estimativa Erro-padrao valor pintercepto −0, 5616 0, 4940 0, 2557centro 1 −0, 6540 0, 2967 0, 0275sexo (feminino) 0, 1945 0, 3709 0, 5999tratamento (ativo) 0, 7339 0, 2889 < 0, 01idade −0, 0252 0, 0111 0, 0232Yi(t−1) 1, 9213 0, 2979 < 0, 01Yi(t−2) 0, 9477 0, 2974 < 0, 01

Para o ajuste desse modelo, sao consideradas apenas as observacoes referentesas visitas 3 a 5, totalizando 333 transicoes. Assim, comparando os modelos de1a e 2a ordens, percebe-se que inclusao de Yi(t−2) como covariavel, acarreta numasensıvel mudanca nos coeficientes de regressao, sendo que Yi(t−1) continua sendoa variavel com maior peso para explicar as probabilidades de transicao, seguidapela covariavel Yi(t−2). Note que para a decisao da ordem da cadeia, incluindo asdemais covariaveis, pode-se usar o criterio da razao de verossimilhancas, a partirdos logaritmos das funcoes de verossimilhancas para os modelos de 1a e 2a ordens.Os valores obtidos sao −166, 79 e −161, 85, respectivamente. L ogo, a estatısticada razao de verossimilhancas e λ = 9, 88, com nıvel descritivo 0, 0016. Esse testeequivale a diferenca de deviances para os modelos encaixados de 1a e 2a ordens,ambos ajustados com 333 observacoes. L ogicamente, nesse estudo, e desnecessariauma extensao para ordens maiores e, os resultados, ratificam a hipotese de queum modelo baseado na cadeia de Markov de ordem 2 e satisfatorio para explicaro comportamento funcional dos dados. Com base nos efeitos significativos dessemodelo, (p < 0, 01), as matrizes de probabilidades de transicao, para os respectivos

96 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 21: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

grupos ativo e placebo, sao:

P (ativo) =

0, 4570 0, 54300, 2460 0, 75400, 1097 0, 89030, 0455 0, 9545

e P (placebo) =

0, 6368 0, 36320, 4046 0, 59540, 2042 0, 79580, 0905 0, 9095

.

Analisando essas matrizes, nota-se que quando o historico do paciente e ruimnas duas ultimas ocasioes, h = (0, 0), a probabilidade de transicao (mudanca) parao estado bom e estimada em 0, 5430 se ele recebe a droga ativa, enquanto que paraum paciente do grupo placebo essa probabilidade e 0, 3632. Essas probabilidadessao maiores se o indivıduo esta bom em ao menos uma das ocasioes anteriores,sempre com diferenca a favor dos pacientes do grupo ativo. As razoes de chancesestimadas para cada possibilidade de historia da cadeia, mantendo-se o efeito daestratificacao por tratamento sao:

ψht=(0,0)= 2, 083; ψht=(0,1)

= 2, 082; ψht=(1,0)= 2, 082; ψht=(1,1)

= 2, 087.

Esses valores evidenciam a homogeneidade da razao de chances em relacao ahistoria da cadeia e, consequentemente pode-se aplicar o teste de Mantel-Haenszelpara comparacao dos grupos ativo e placebo. A estatıstica do teste e ZM H = 2, 43,com nıvel descritivo igual a 0, 0074, indicando forte evidencia a favor do tratamentoativo. O aumento da ordem da cadeia, nesse caso, nao muda as consideracoes comrespeito a discriminacao entre os tratamentos.

Conclusoes

Os modelos de transicao de Markov constituem-se em uma classe de modelos

condicionais, uma vez q ue se tem interesse em modelar a distrib uicao condicional

da resp osta no temp o t, dada uma ou mais resp ostas p revias e um conjunto de

covariaveis. E ssa metodolog ia tem estreita relacao com as areas das ciencias medica,

veterinaria e afi ns, uma vez q ue e p lausıvel admitir q ue o estado de um indivıduo

numa dada ocasiao p ossa ter infl uencia sob seu estado num temp o futuro. D esse

modo, a avaliacao de drog as terap euticas deve levar em conta a p ossib ilidade dessa

infl uencia, q ue nao e “ mensurada” , ao se adotar na estrutura modelos marg inais.

A ssim, ao se emp reg ar um modelo de transicao, a h ip otese nula inicial a ser

ex p lorada e a q uestao da dep endencia do temp o, b em como a ordem da cadeia.

A estacionariedade do p rocesso e semp re desejavel, mas nem semp re ocorre.

H a, ainda, outras q uestoes q ue merecem atencao e estudos nessa area.

P rimeiro, a metodolog ia ap resentada neste trab alh o p ode ser estendida p ara mais de

duas categ orias de resp osta, usando o modelo de ch ances p rop orcionais. S eg undo, os

testes p rop ostos sao assintoticos e p odem nao ser validos q uando nao h a um numero

razoavel de freq uencias de transicoes. Q uanto ao teste p ara comp arar tratamentos

p elas p rob ab ilidades de transicao, ele nao e restrito ao caso de dois tratamentos.

Rev. B ra s. B io m ., S a o P a u lo , v .2 5 , n .4 , p .7 7 -1 0 0 , 2 0 0 7 9 7

Page 22: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

Para mais de dois tratamentos, podem-se efetuar comparacoes duas a duas, mas ha

necessidade de se corrigir o nıvel de significancia.

Observacoes omissas tambem sao comuns em estudos longitudinais. Para

os modelos marginais, as equacoes de estimacao garantem a consistencia das

estimativas dos parametros sob a condicao de que essas perdas sejam completamente

ao acaso, ou seja, se uma obervacao e perdida, ela nao pode depender das respostas

previas. Assim, com modelos de transicao, valores perdidos podem inviabilizar a

analise, uma vez que, por definicao, sao modelos condicionais. Por isso, em geral,

quando uma observacao e perdida, o perfil individual de respostas e excluıdo da

contribuicao para a funcao de verossimilhanca. Para o caso do modelo de Markov de

primeira ordem, alguns estudos indicam como uma alternativa, tratar a observacao

apos um valor omisso como se fosse a primeira observacao. Outra alternativa e

aumentar a ordem da cadeia, que certamente traz penalizacoes pelo aumento no

numero de parametros.

L AR A, I. A. R .; DEMET R IO, C . G . B .; AN DR ADE, D. F .; MOT A, J . M. A.

T ransition models for binary data: tests to compare treatments. Rev. Mat. Estat.,

Sao Paulo, v.2 5 , n.4 , p.7 7 -1 0 0 , 2 0 0 7 .

ABSTRACT: This work focus on generalized linear transition models suitable for

analy zing longitudinal data with binary resp onse. Such models are based on stochastic

p rocesses and we aim to model the p robabilities of change or transitions of indiv idual

resp onse categories in time. The max imum likelihood ap p roach is used in order to fi t

the models and estimate the p robabilities. F urthermore, we p rop ose asy mp totic tests to

comp are treatments based on odds ratio and on the diff erences of transition p robabilities.

The methods are illustrated with resp iratory disease data. F or these data, the p rocess is

stationary of order two and the suggested test p oints to a signifi cant statistical diff erence

in fav our of the activ e treatment.

K E Y W O RD S: L ongitudinal data; generalized linear model; stochastic p rocesses;

transition p robabilities; max imum likelihood.

Referencias

AG R EST I, A. C atego rical d ata an aly sis. N ew Y ork: J onh W iley , 1 9 9 1 . 5 5 8 p.

AN DER SON , T . W .; G OODMAN , L . A. Statistical Inference about Markov C hains.

A n n . Math . S tat.. Ann Arbor, v.2 8 , p.8 9 -1 1 0 , 1 9 5 7 .

AZ Z AL IN I, A. Maximum likelihood estimation of order n for stationary stochastic

processes. B io m etrika, C ambridge, v.7 0 , p.3 8 1 -3 8 8 , 1 9 8 3 .

B ISHOP, Y . M. M.; F IEN B ER G , S. E.; HOL L AN D, P. W . D iscrete m u ltivariate

an aly sis: th eo ry an d p ractice. Massachussetts: T he MIT Press, 1 9 7 5 . 5 5 7 p.

C OX , D. R . T h e an aly sis o f bin ary d ata. L ondon: Methuen, 1 9 7 0 . 1 4 2 p.

98 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007

Page 23: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

DIGGLE, P. J. et al. Analysis of longitudinal data. New York: Oxford U niversityPress, 2002. 379p.

FITZMAU RICE, G. M.; LAIRD, N. M. A likelihood-based method for analysinglongitudinal binary responses. Biometrika, Cambridge, v.80, p.141-151, 1993.

GOOD, I. J. The likelihood ratio test for Markov chains. Biometrika, Cambridge,v.42, p.531-533, 1955.

GOODMAN, L. A. Statistical Methods for analysing processes of change. Am. J .Sociol., Chicago, v.6 8, p.57-78, 196 2.

K OCH, G. C. et al. Categorical data analysis. In: BERRY, D.A. Statisticalmethodology in the pharmaceutical sciences. New York: Marcel Dekker, 1990.chap.13, p.389-473.

K ORN, E. L.; WHITTEMORE, A. S. Methods for analysing panel studies of acutehealth eff ects of air pllution. Biometrics, Washington, v.35, p.715-802, 1979.

LIANG, K . Y.; ZEGER, S.L. Longitudinal data analysis using generalized linearmodels. Biometrika, Cambridge, v.73, n.1, p.13-22, 1986 .

LINDSEY, J. K . Modelling frequency and count data. Oxford: Oxford U niversityPress, 1995. 300p.

LINDSEY, J. K . Statistical analysis of stochastic processes in time. New York:Cambridge U niversity Press, 2004. 338p.

MANTEL, N.; HAENSZEL, B. F. Statistical aspects of the analysis of the datafrom retrospective studies of disease. J . Am. Stat. Assoc., Boston, v.58, p.6 90-700,1959.

McCU LLAGH, P. Regression methods for ordinal data. J. R. Stat. Soc., Ser. BMethodol., London, v.42, p.109-142, 1980.

MOLENBERGS, G.; V ERBEK E, G. Models for discrete longitudinal data. NewYork: Springer-V erlag, 2005, 6 83p.

NELDER, J. A.; WEDDERBU RN, R. W. M. Generalized linear models. J . R. Stat.Soc., Ser. A Gen., London, v.135, p.370-384, 1972.

NOLETO, A. Q. Analise de dados longitudinais com respostas categorizadasatraves de processos de Markov. 1991. 93f. Dissertacao (Mestrado em Estatıstica)-U niversidade Estadual de Campinas, Campinas, 1991.

PAU LA, G. A. Modelos de regressao com apoio computacional. Sao Paulo: IME,2004. 245p.

R Development Core Team. R: A language and environment for statisticalcomputing 2 .5 .1 . V ienna, Austria, 2007. Disponıvel em <http:/ / www.R-project.org>. Acesso em: 25 ago. 2007.

SAS INSTITU TE INC. SAS/STAT user’s guide, V ersion 8 . Carry NC, 1999.

WARE, J. H.; LIPSITZ, S.; SPEIZER, F. E. Issues in the Analysis of RepeatedCategorical Outcomes. Stat. Med., Chichester, v.7, p.95-107, 1988.

Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007 99

Page 24: MODELOS DE TRANSIC»A~O P ARA DADOS B INA¶RIOS ... - Unespjaguar.fcav.unesp.br/RME/fasciculos/v25/v25_n4/A5... · 2 Material e m¶etodos 2.1 Material Os dados desse exemplo referem-se

ZEGER, S. L.; LIANG, K. Y. Longitudinal data analysis for discrete and continousoutcomes. Biometrics, Washington, v.42, p.121-130, 1986.

ZEGER, S. L.; LIANG, K. Y.; SELF, S. G. The analysis of binary longitudinal datawith time-independent covariates. Biometrika, Cambridge, v.72, p.31-38, 1985.

ZEGER, S. L.; QAQISH, B. Markov regression models for time series: a quase-likelihood aproach. Biometrics, Washington, v.44, p.1019-1031, 1988.

Recebido em 14.09.2007.

Aprovado apos revisao em 06.03.2008.

100 Rev. Bras. Biom., Sao Paulo, v.25, n.4, p.77-100, 2007