Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This...

11
713 Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998 ARTIGO ARTICLE Mapas de taxas epidemiológicas: uma abordagem Bayesiana Maps of epidemiological rates: a Bayesian approach 1 Departamento de Estatística, Universidade Federal de Minas Gerais. Caixa Postal 702, Belo Horizonte, MG 30161-970, Brasil. [email protected] [email protected] 2 Laboratório de Epidemiologia e Antropologia Médica, Instituto René Rachou, Fundação Oswaldo Cruz. Av. Augusto de Lima 1715, Belo Horizonte, MG 30190-002, Brasil. Renato Martins Assunção 1 Sandhi M. Barreto 2 Henrique L. Guerra 2 Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of disease rates when the geographic units have small populations at risk. They adopt the Bayesian approach and use intensive computational methods for estimating risk in each area. The objec- tive of the methods is to separate the variability of rates due to differences between regions from the background risk due to pure random fluctuation. Risk estimates have a total mean quadratic error smaller than usual estimates.We apply these new methods to estimate infant mortality risk in the municipalities of the State of Minas Gerais in 1994. Key words Maps; Epidemiology; Medical Geography; Small-Area Analysis Resumo Neste artigo, apresentamos métodos estatísticos desenvolvidos recentemente para a análise de mapas de taxas de morbidade quando as unidades geográficas possuem pequenas po- pulações de risco. Eles adotam a abordagem Bayesiana e utilizam métodos computacionais in- tensivos para estimação do risco de cada área. O objetivo dos métodos é separar a variabilidade das taxas devida às diferenças entre as regiões do risco subjacente daquela devida à pura flutua- ção aleatória. As estimativas de risco possuem um erro quadrático médio total menor que as es- timativas usuais. Aplicamos esses novos métodos para estimar o risco de mortalidade infantil nos municípios de Minas Gerais em 1994. Palavras-chave Mapas; Epidemiologia; Geografia Médica; Análise de Pequenas Áreas

Transcript of Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This...

Page 1: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

713

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

ARTIGO ARTICLE

Mapas de taxas epidemiológicas: uma abordagem Bayesiana

Maps of epidemiological rates: a Bayesian approach

1 Departamento deEstatística, UniversidadeFederal de Minas Gerais.Caixa Postal 702,Belo Horizonte, MG 30161-970, [email protected] [email protected] 2 Laboratório deEpidemiologia eAntropologia Médica,Instituto René Rachou,Fundação Oswaldo Cruz.Av. Augusto de Lima 1715,Belo Horizonte, MG 30190-002, Brasil.

Renato Martins Assunção 1

Sandhi M. Barreto 2

Henrique L. Guerra 2

Emília Sakurai 1

Abstract This article presents statistical methods recently developed for the analysis of maps ofdisease rates when the geographic units have small populations at risk. They adopt the Bayesianapproach and use intensive computational methods for estimating risk in each area. The objec-tive of the methods is to separate the variability of rates due to differences between regions fromthe background risk due to pure random fluctuation. Risk estimates have a total mean quadraticerror smaller than usual estimates. We apply these new methods to estimate infant mortality riskin the municipalities of the State of Minas Gerais in 1994.Key words Maps; Epidemiology; Medical Geography; Small-Area Analysis

Resumo Neste artigo, apresentamos métodos estatísticos desenvolvidos recentemente para aanálise de mapas de taxas de morbidade quando as unidades geográficas possuem pequenas po-pulações de risco. Eles adotam a abordagem Bayesiana e utilizam métodos computacionais in-tensivos para estimação do risco de cada área. O objetivo dos métodos é separar a variabilidadedas taxas devida às diferenças entre as regiões do risco subjacente daquela devida à pura flutua-ção aleatória. As estimativas de risco possuem um erro quadrático médio total menor que as es-timativas usuais. Aplicamos esses novos métodos para estimar o risco de mortalidade infantilnos municípios de Minas Gerais em 1994.Palavras-chave Mapas; Epidemiologia; Geografia Médica; Análise de Pequenas Áreas

Page 2: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

ASSUNÇÃO, R. M. et al.714

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

Introdução

A análise da dispersão espacial do risco de umadoença é feita principalmente através de ma-pas de taxas de incidência ou alguma outra me-dida epidemiológica de risco. Estes mapas sãoinstrumentos valiosos em estudos epidemioló-gicos e podem-se listar três objetivos principaisde sua produção. O primeiro é descritivo e con-siste da simples visualização da distribuiçãoespacial da doença na região de interesse. Glasset al. (1995), por exemplo, produziram um ma-pa de risco de doença de Lyme a partir de dadosepidemiológicos e de um sistema de informa-ção geográfica. O segundo objetivo, explorató-rio, é sugerir determinantes locais de doenças efatores etiológicos desconhecidos que possamser formulados em termos de hipóteses a sereminvestigadas posteriormente. Por exemplo, Ma-son (1995) apresenta os vários estudos de cam-po realizados como conseqüência das questõesligadas aos determinantes ambientais do cân-cer levantadas após analise dos diversos atlaseditados pelo National Cancer Institute ame-ricano. Estes estudos abrangem câncer oral(Winn et al., 1981), câncer do intestino (Pickle etal., 1981), câncer de pulmão (Ziegler et al., 1984),câncer de bexiga (Hoover & Strasser, 1980). Fi-nalmente, um terceiro objetivo é apontar asso-ciações entre fontes potenciais de contamina-ção e áreas de risco elevado, tal como aumentode risco de leucemia infantil nas proximidadesde instalações nucleares (Diggle et al., 1990; El-liot et al., 1992). Neste caso, existe uma hipóte-se ou suspeita prévia de que a vizinhança deum ou mais pontos pré-especificados possuemrisco mais elevado e trata-se então de obterevidência da existência desse efeito.

A maior parte dos mapas epidemiológicossão constituídos por mapas temáticos onde umconjunto de áreas é sombreada de acordo comseus valores para certa variável de interesse.Considere, por exemplo, o mapa da Figura 1que mostra Minas Gerais subdividida nos seus756 municípios existentes em 1994. De acordocom o valor da razão de mortalidade infantilpadronizada (RMP ou, em inglês, SMR), os mu-nicípios receberam diferentes cores e/ou tona-lidades. Este número é igual a 100 vezes a razãoentre o número observado Yi de óbitos em me-nores de um ano no município i e o seu núme-ro esperado Ni . r sob risco constante, onde Ni

é o número de nascidos vivos em 1994 no mu-nicípio i e r é a razão entre o número total deóbitos em menores de um ano e o número to-tal de nascidos vivos no estado.

O mapa fornece uma descrição da distri-buição da mortalidade infantil no estado e sua

característica mais saliente é a forte correlaçãoespacial entre as taxas: municípios vizinhostendem a ter taxas mais similares do que doismunicípios escolhidos ao acaso dentre os 756existentes. Bolsões com taxas padronizadasmuito elevadas ou muito baixas são facilmen-te percebidos no extremo nordeste e extremonoroeste. Note que os municípios com RMPiguais a zero foram deixados sem cor.

O mapa também apresenta característicasque revelam alguns dos seus problemas. Nota-se a presença de alguns municípios com valo-res muito diferentes de seus vizinhos. Isto criauma aparência de colcha de retalhos que difi-culta a visualização de tendências e gradientesem larga escala. Mais importante ainda, váriosdos valores discrepantes e mais extremos sãocausados por flutuação aleatória, sem nenhu-ma associação com o risco subjacente. Quandoo número de nascidos vivos é pequeno, a RMPpode variar enormemente devido a uma pe-quena mudança no número de óbitos. Consi-derando que a extensão de sub-registro de nas-cimentos e de óbitos infantis no Brasil variamuito por município, esse comportamento daRMP causa preocupação.

Esse grau de variabilidade aleatória da RMPestá associado ao tamanho das unidades geo-gráficas de análise. Por um lado, para alcançarplenamente seus objetivos, os mapas devempossuir resolução geográfica adequada. Istoimplica que a maior utilidade dos mapas ocor-re quando eles utilizam pequenas regiões geo-gráficas como unidades de análise. Por outrolado, várias dessas pequenas regiões possuirãopequenas populações de risco o que acarretaráestimativas de risco muito instáveis. Isto é, oacréscimo ou decréscimo de um único casonestas áreas poderá causar mudanças drásti-cas nas estimativas. Em termos estatísticos, asestimativas das diversas áreas não são compa-ráveis já que possuem variâncias muito dife-rentes. A dependência da variância de RMP notamanho da população de risco é vista clara-mente na Figura 2 que mostra um gráfico dedispersão de RMP versus o logaritmo do núme-ro de nascidos vivos para os municípios de Mi-nas Gerais em 1994. Quanto menor o tamanhoda população de risco, maior a variabilidadeda RMP.

Flutuações extremas nas taxas dissociadasdos riscos subjacentes levam, algumas vezes, àdecisão de não divulgá-las quando as áreassão muito pequenas como, por exemplo, a ní-vel municipal. Uma alternativa é então perderresolução fazendo um mapa subdividido emáreas de análise maiores por meio da agrega-ção das áreas menores. No entanto, isto entra

Page 3: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

em conflito com um dos principais objetivosde se fazer os mapas que seria a identificaçãodas áreas de maior risco para orientar inter-venções de saúde pública. É fundamental alo-car recursos de forma não-agregada, respei-tando as diferenças e necessidades locais, quesó podem ser avaliadas quando as áreas deanálise são pequenas o suficiente. As flutua-ções aleatórias podem ser ainda maiores emestudos de mortalidade segundo causa especí-fica, essencial para a monitorização de açõesepidemiológicas e de saúde pública no nívellocal.

Num artigo clássico e pioneiro, Choynows-ki (1959) considera a ocorrência de tumorescerebrais em condados poloneses. Ele notaque os dois casos observados em Lesko compopulação de 17000 habitantes gera uma taxarelativamente extrema de 11,8 por 100 mil. Setivesse ocorrido apenas um caso, ao invés dosdois observados, essa taxa seria de 5,9, um va-lor consistente com as taxas dos outros conda-dos. Este problema também está presente emnossos dados. Existem 15 municípios com ne-nhum óbito registrado e com número de nas-cidos vivos inferior a 30 implicando uma RMPigual a zero. Se uma única morte houvesse si-do registrada nesses municípios, as razões demortalidade padronizada passariam de 0 paravalores entre 116 e 1048. O último valor corres-ponderia a um município com risco relativoestimado 10 vezes maior que a média do esta-do e passaria então a ser o mais alto substi-tuindo o valor extremo de fato observado quefoi 609. Teríamos assim os aspectos mais sa-lientes do mapa causados pela sensibilidadeextrema da RMP a pequenas mudanças no nu-merador, possivelmente devidas a flutuaçõesaleatórias não associadas ao verdadeirro riscosubjacente.

Para evitar esse efeito drástico de mudan-ças mínimas no número de óbitos registrados,Choynowski (1959) propõe fazer mapas substi-tuindo as taxas por probabilidades similares aop-valor de um teste. Um mapa temático basea-do nessa proposta é chamado de mapa de pro-babilidade. Embora a idéia deste mapa sejapermitir comparações por meio da padroniza-ção das taxas em uma escala de probabilidade,isto não é possível se algumas populações derisco são grandes pois então teremos valoresextremos da probabilidade como conseqüên-cia do poder do teste para detectar pequenosafastamentos da hipótese de risco constanteutilizada para o cálculo das probabilidades(Cressie, 1991).

Existem outras desvantagens na utilizaçãodesses mapas de probabilidade. Os p-valores

MAPAS DE TAXAS EPIDEMIOLÓGICAS 715

não possuem uma interpretação epidemiológi-ca clara. Eles também não levam em conta asesperadas similaridades entre áreas contíguas.Estas similaridades são devidas à usual varia-ção suave do risco sobre a área sendo mapea-da. Incorporar esta informação nas estimati-vas de risco pode levar a mapas com menosflutuação aleatória e assim a uma diferencia-ção mais precisa entre o que é de fato riscoelevado e o que é flutuação aleatória causadapor pequenas populações ou grande potênciade detectar diferenças substantivamente des-prezíveis.

Para superar estas dificuldades, métodosBayesianos empíricos ou inteiramente Baye-sianos têm sido propostos na literatura. Estesmétodos, ao estimar o risco de uma pequenaárea, têm como idéia central o uso de informa-ção das outras áreas que compõem a região deestudo para diminuir o efeito das flutuaçõesaleatórias não associadas ao risco. Ao levaremem conta a correlação espacial entre áreas vizi-nhas, os mapas resultantes são mais suaves emais informativos (Mason et al., 1975; Masonet al., 1976). A principal conseqüência é que oconjunto dos riscos relativos de todas as áreasé estimado de forma mais precisa do que aousar a RMP. Isto é, pode-se diminuir substan-cialmente o erro quadrático médio total da es-timação dos riscos. Os ganhos em termos dodecréscimo do erro quadrático de estimaçãopodem ser substanciais.

Os primeiros avanços estatísticos usaram aabordagem Bayesiana empírica (Tsutakawa,1988; Tsutakawa et al., 1985; Manton et al.,1989). Em 1987, Clayton & Kaldor propuseramincluir uma especificação a priori espacial pa-ra levar em conta a correlação entre áreas vizi-nhas. Em seguida, Clayton (1989) propôs umaabordagem Bayesiana hierárquica que nãopossui as desvantagens da RMP e mostra algu-mas vantagens comparadas com as alternati-vas Bayesianas empíricas (Bernadinelli & Mon-tonolli, 1992).

Mais recentemente, Besag et al. (1991) pro-puseram uma abordagem em que os dadosobservados são o produto de dois estágios. Noprimeiro, o risco relativo de cada área é a somade dois componentes representando fatoresespaciais e não-espaciais. No segundo, dadoeste risco a priori e as populações de risco, acontagem da característica de interesse em ca-da área tem distribuição Poisson com médiaespecificável. As distribuições a priori para oscomponentes do primeiro estágio podem serescolhidas de modo a refletir o conhecimentoepidemiológico sobre a doença na área, in-cluindo com diferentes escopos, as variáveis

Page 4: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

ASSUNÇÃO, R. M. et al.716

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

não-observadas, como em Bernadinelli et al.(1995a; 1995b). A correlação espacial seria exi-bida apenas por aquelas variáveis com variabi-lidade de larga escala relativa, enquanto queaquelas com variação de pequena escala se-riam mais restritas às pequenas áreas sob con-sideração e não teriam estrutura espacial.

Modelo hierárquico Bayesiano

Nesta seção, nós introduzimos concisamente omodelo Bayesiano hierárquico espacial. Umarevisão detalhada foi apresentada por Bernadi-nelli & Montomoli (1992). A estrutura estatísti-ca de nosso problema, considerando um estu-

Figura 1

Mapa das razões de mortalidade infantil padronizada (RMP) dos 756 municípios mineiros em 1994.

300 to 620 (8)

200 to 300 (39)

150 to 200 (72)

120 to 150 (70)

80 to 120 (203)

50 to 80 (138)

25 to 50 (91)

0 to 25 (135)

RMP, Minas Gerais, 1994

Minas Gerais

Page 5: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

MAPAS DE TAXAS EPIDEMIOLÓGICAS 717

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

do de mortalidade para n municípios, indexa-dos por i = 1,...,n, pode ser descrita a partir detrês informações: dos riscos relativos ψi, queexpressam as difrenças relativas entre os mun-cípios; dos valores observados de óbitosY1,...,Yn e dos esperados de óbitos E1,....,En ob-tidos aplicando-se taxas de referência apro-priadas à população local, sob a hipótese deque, em cada categoria de idade, o risco é cons-tante para todas os municípios. Desse modo, nomunicípio i, o número de mortes esperado édados Eiψi. Assim, parte da variação das obser-vações é devida a uma flutuação aleatória emcima dos riscos subjacentes. Ainda mais, pode-se dizer que, de posse dos valores Ei e de ψi, onúmero de óbitos no município i segue umadistribuição de Poisson com média igual a Eiψi.

O risco relativo ψi é o produto de dois com-ponentes independentes: o primeiro registra oefeito aleatório não-espacial (θi), enquanto queo segundo é o efeito aleatório espacial do mu-nicípio i (φi).

Os elementos θi do primeiro componentepossuem distribuições normal independentescom média 0 e variância 1/τθ . A distribuição deprobabilidades do segundo componente é de-finida de modo a incentivar áreas vizinhas a se-rem mais semelhantes em termos de risco demortalidade do que duas áreas escolhidas aoacaso. Na linguagem estatística, diz-se que pa-ra um município i, a distribuição de φi, em fun-ção do restante do conjunto dos φk, k ≠ i, é defi-nida por um campo de Markov, em que a dis-tribuição condicional desse segundo compo-nente depende apenas de sua vizinhança ∂i . Is-to implica que φi possui distribuição normalcom média m∂i e variância σ2∂i onde m∂i é a mé-dia dos φk vizinhos de i e σ2∂i é inversamenteproporcional ao número de vizinhos do lote i.

Os hiperparâmetros τθ e τφ possuem umadistribuição a priori, a escolha comum recain-do sob uma distribuição qui-quadrado ou umadistribuição gama. Neste artigo, nós seguimosBernadinelli & Montomoli (1992) e estabelece-

0 2 4 6 8 10 12 logaritmonascidos vivos

-100

0

100

200

300

400

500

600

700

razã

o d

e m

orta

lidad

e p

adro

niza

da

Figura 2

Diagrama de dispersão do logaritmo do número de nascidos vivos no município (eixo horizontal)

versus RMP (eixo vertical).

Page 6: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

ASSUNÇÃO, R. M. et al.718

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

mos que τφ possui distribuição igual a a . χ2v/v e

τθ possui distribuição b . χ2u/u onde a e b são

duas constantes especificadas representandoestimativas a priori de τθ e τφ . Essas constantessão escolhidas, por exemplo, supondo que osriscos relativos das diversas áreas devem variarentre, digamos, 1/3 e 3 para a maioria dos mu-nicípios (Bernadinelli e Montomoli, 1992). Osgraus de liberdade u e v representam o grau deconfiança nessas estimativas a priori.

A inferência Bayesiana segue da análise dadensidade a posteriori conjunta dos dois parâ-metros referentes à estrutura espacial e não-espacial (φ1,...,φn, θ1,...,θn, τφ, τθ). Um método dese obter essa distribuição conjunta é através dasimulação de um número suficientementegrande de observações dependentes do vetorde parâmetros como uma cadeia de Markov er-gódica (Besag et al., 1991; Besag & Green,1993). Esse método é conhecido como Amos-trador de Gibbs e pode ser implementado atra-vés do uso do software BUGS, disponível gra-tuitamente na internet no endereço http://www.mrc-bsu.cam.ac.uk/bugs. A distribuiçãoassintótica desta cadeia é a distribuição con-junta a posteriori do vetor de parâmetros e as-sim, se a cadeia é longa o suficiente, observa-ções podem ser obtidas para construir umafunção de distribuição empírica a partir daqual pode-se estudar as propriedades da distri-buição a posteriori do vetor de parâmetros. Porexemplo, a estimativa pontual para o risco rela-tivo é a média a posteriori da distribuição de ψi.

Resultados

Para implementar a metodologia, definimosuma estrutura de vizinhança simples. Algunsmunicípios tiveram como vizinhos todos aque-les que tinham suas sedes a um raio menor que5 unidades na escala do mapa enquanto paraoutros foi adotado o raio de 10. Os municípioscom raio menor são aproximadamente aquelesda metade inferior do mapa onde as sedes es-tão muito próximas. O raio maior foi adotadopara aqueles que tinham áreas maiores e sãoesparsamente povoados como os do norte deMinas. Os graus de liberdade das distribuiçõesdos hiperparâmetros foram iguais a 1 e asconstantes daquelas distribuições foram esco-lhidas de modo a permitir uma variação relati-va a priori dos riscos de até 4 vezes um valormédio. Simulações com outras escolhas dosparâmetros não apresentam mudanças signifi-cativas nos resultados.

A Figura 3 mostra o resultado da aplicaçãoda metodologia proposta aos municípios mi-

neiros. Os eixos vertical e horizontal possuema mesma escala e a linha sólida no gráfico é areta y = x. As estimativas Bayesianas do riscorelativo são muito mais concentradas do queas estimativas fornecidas pelas RMP. O efeitodesta contração das estimativas é maior nosvalores extremos de RMP. Valores acima de 300foram reduzidos enquanto valores próximosou abaixo de zero foram puxados para perto damédia da distribuição. O efeito da contraçãodepende da população em risco de cada muni-cípio. Aqueles com grande população não tive-ram grandes mudanças em relação à RMP jáque estas devem ser estimativas confiáveis dorisco subjacente. Já aqueles com pequena po-pulação de risco usaram também a informaçãovinda dos municípios vizinhos já que a RMPseria instável.

O efeito visual das estimativas Bayesianaspode ser observado no mapa da Figura 4. Omapa possui uma aparência muito mais suavee demonstra mais claramente os padrões espa-ciais do risco de mortalidade infantil. Os bol-sões de riscos relativos semelhantes são nítidose facilmente identificáveis. Além disto, as esti-mativas municipais podem ser analisadas commais segurança pois são estimadas com maiorestabilidade. Os valores discrepantes resultan-tes podem ser estudados sem o temor de quesejam resultado de flutuação aleatória causadapor populações pequenas. Nota-se, por exem-plo, um município, Caetanópolis, na regiãocentral do estado com uma estimativa acimade 200 cercado por municípios com riscos rela-tivos entre 100 e 150. A região do noroeste mi-neiro apresenta riscos relativos baixos e é mui-to homogênea. A partir do sul de Minas, pas-sando pela Zona da Mata, Vale do Rio Doce eZona Metalúrgica até o Médio Jequitinhonhano extremo nordeste podemos enxergar umgradiente de aumento do risco que é quebradopelo bolsão de risco relativo baixo na região doAlto Jequitinhonha. Esta descontinuidade nogradiente pode ser explicada pelo sub-registrode óbito. Análises específicas e localizadas in-cluindo estudos de tendências temporais empequenas áreas podem ser realizadas com ma-pas produzidos com esta metodologia.

Simulação

Como demonstrar que a metodologia propostaneste artigo é melhor que o uso das tradicio-nais RMP? Uma prova definitiva seria atravésda comparação entre os erros médios da esti-mação dos riscos feita pelos dois métodos. Noentanto, isto é impossível já que os riscos não

Page 7: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

MAPAS DE TAXAS EPIDEMIOLÓGICAS 719

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

podem ser observados diretamente. No con-texto de modelos probabilísticos é possívelmostrar que as estimativas Bayesianas são me-lhores que a RMP (Lehman, 1983). No entanto,para argumentar a favor de nossa proposta,utilizamos um método de simulação que nosparece simples e convincente. Tomamos o ris-co relativo estimado pelo método Bayesianocomo se fosse o risco verdadeiro, não observa-do, e aplicamos este risco nos nascidos vivosde cada município para obter o risco de óbitoinfantil no município. A seguir, simulamos onúmero de mortes em cada município de acor-do com a distribuição de Poisson. Tomando es-tes novos dados, ajustamos o modelo Bayesia-no e obtivemos os riscos relativos estimadospelo método Bayesiano e pelas RMP.

A comparação entre esses dois conjuntosde estimativas é feita através da Figura 5 e cal-culando-se o erro médio quadrático de estima-ção de cada um. Este erro médio é definido co-mo EQM = Σi (ψi - ψ̂i)2, onde o elemento comchapéu é a estimativa do risco relativo. Na Fi-

gura 5 fica claro que as estimativas Bayesianassão muito estáveis e precisas na estimação dorisco relativo. A diferença entre os métodos e oerro de estimação de RMP é maior quando onúmero de nascidos vivos é pequeno. O erromédio quadrático do estimador Bayesiano é73,9 enquanto o das razões RMP é igual a2116,7, uma diferença relativa de 97% em rela-ção a este último. Trocando o critério de medi-ção do erro médio não muda muito os resulta-dos. Por exemplo, ao invés do erro quadrático,o erro absoluto relativo médio, em termos per-centuais, do estimador Bayesiano é 6% enquan-to o das taxas RMP é igual a 34%. Como se vê, adiferença é bastante significativa em favor dasestimativas Bayesianas.

Conclusão

Neste artigo, utilizamos um método Bayesianopara estimar o risco relativo de mortalidade in-fantil nos municípios de Minas Gerais usando

Figura 3

Gráfico de dispersão de RMP (eixo horizontal) versus estimativa Bayesiana (eixo vertical).

-100 0 100 200 300 400 500 600 700 razão de mortalidade padronizada

-100

0

100

200

300

400

500

600

estim

ativ

a b

ayes

iana

Page 8: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

ASSUNÇÃO, R. M. et al.720

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

os dados de 1994. O método é intensivo com-putacionalmente e utiliza métodos Monte Car-lo via Cadeias de Markov para estimar a distri-buição a posteriori dos riscos relativos. Alémdisto, o modelo é intrisicamente espacial in-corporando um componente que capta a varia-ção suave de larga escala do risco no estado. Oresultado é o decréscimo da influência de fato-res aleatórios não relacionados com o riscosubjacente e a produção de mapas mais con-fiáveis e fáceis de interpretar.

É importante salientar que este métodonão afeta erros sistemáticos como aqueles cau-sados por sub-registro e isto implica que a in-terpretação dos mapas requer um conheci-mento sobre a qualidade dos dados e as áreasestudadas. Note, por exemplo, que o sub-regis-tro de óbitos parece ser a explicação mais plau-sível para o bolsão de baixo risco estimado nomapa Bayesiano no Alto Jequitinhonha e tam-bém no Norte de Minas, já que estas áreas es-tão entre as mais pobres de Minas Gerais. O

Figura 4

Mapa das estimativas Bayesianas dos riscos relativos de mortalidade infantil dos 756 municípios mineiros em 1994.

200 to 300 (14)

150 to 200 (38)

120 to 150 (91)

80 to 120 (442)

50 to 80 (164)

25 to 50 (7)

EBE, Minas Gerais, 1994

Minas Gerais

Page 9: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

MAPAS DE TAXAS EPIDEMIOLÓGICAS 721

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

sub-registro de óbitos e nascimentos tende aser maior exatamente nessas áreas menos de-senvolvidas, compostas de municípios poucopopulosos e predominantemente rurais. Osub-registro de nascimentos teria um impactomaior nos municípios menos populosos, em-bora este efeito tenda a produzir oscilaçõesmenores que o sub-registro de óbitos. Primei-ro, porque ele afetaria o denominador dessas

taxas que é um número muito maior que o deóbitos. Segundo, porque o registro de nasci-mentos tende a crescer com o tempo de sobre-vida da criança, ou seja, haveria um maior sub-registro de crianças que faleceram precoce-mente.

Existe um grande campo para explorar me-lhorias no método. Uma das característicasmais marcantes do método é o campo de Mar-

Figura 5

Resultados referentes à simulação. O primeiro gráfico é do risco relativo versus a estimativa Bayesiana.

O segundo gráfico é de RMP versus a estimativa Bayesiana e o terceiro é de RMP versus o risco relativo.

O quarto gráfico é logaritmo de nascidos vivos versus o erro de estimação usando RMP.

estim

ativ

a b

ayes

iana 100

0

0

200

300

100 200 300

risco relativo

-100 0 100 200 300 400 500 600 700

estim

ativ

a b

ayes

iana

0

100

200

300

400

500

600

RMP simulada

5b5a

RMP

sim

ulad

a

-100

100

0

200

300

400

500

600

700

0 100 200 300

risco relativo

400 500 600

-200RMP

sim

ulad

a –

risco

rel

ativ

o

-100

0

100

200

300

400

500

0 2 4 6

logaritmo dos nascidos vivos

8 10 12

5d5c

Page 10: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

ASSUNÇÃO, R. M. et al.722

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

Referências

ANDES, N. & DAVIS, J. E., 1995. Linking public datausing geographical information systems tech-niques: alaskan community characteristics andinfant mortality. Statistics in Medicine, 14:481-490.

BERNADINELLI, L. & MONTONOLLI, C., 1992. Em-pirical bayes versus fully bayesian analysis of ge-ographical variation in disease risk. Statistics inMedicine, 11:983-1007.

BERNADINELLI, L.; CLAYTON, D. & MONTOMOLI,C., 1995a. Bayesian estimates of disease maps:how important are priors ? Statistics in Medicine,14:2411-2431.

BERNADINELLI, L.; CLAYTON, D.; PASCUTTO, C.;MONTONOLLI, C.; GHISLANDI, M. & SONGINI,M., 1995b. Bayesian analysis of space-time varia-tion in disease risk. Statistics in Medicine, 14:2433-2443.

Agradecimentos

Desejamos agradecer ao Cedeplar-UFMG e ao Officeof Population Research-Princeton University pelo ex-celente ambiente de trabalho que proporcionaram aoprimeiro autor durante a realização deste artigo e aEdna A. Reis pela ajuda com o texto. Foram muitobenéficas as discussões mantidas com Diana Sawyere equipe, German Rodrigues, Burton Singer e MaxWoodbury. Este trabalho contou com o apoio da Fun-dação Rockfeller, IDRC-Canadá, Fapemig e CNPq.

kov que permite correlação entre as áreas. Estecampo é definido parcialmente pela estruturade vizinhança adotada. Existem várias possibi-lidades para essa estrutura de vizinhança e oefeito de mudanças de vizinhanças nas estima-tivas não foi estudado na literatura. Por exem-plo, pode-se definir como vizinhos dois muni-cípios que possuam fronteira comum. Outraalternativa é considerar como vizinhos de ummunicípio todos aqueles que estejam num raiode x quilômetros de sua sede. Nas duas alter-nativas acima, teremos um número variável devizinhos. Outra possibilidade que mantém umnúmero fixo de vizinhos é tomar apenas aque-les municípios que correspondem às k sedesmais próximas do município base. Nós plane-jamos estudar uma estrutura diferente onde onúmero de vizinhos é variável mantendo, noentanto, a população de risco destes municí-pios aproximadamente constante. Nós toma-

remos como vizinhos aqueles mais próximosaté que se ultrapasse um ponto de corte na po-pulação de risco acumulada. Isto equaliza onúmero de casos utilizados para estimar cadarisco.

Várias áreas da epidemiologia podem sebeneficiar do método proposto aqui. Uma de-las é a correção de sub-registro de pequenasáreas onde a incerteza nas estimativas das ta-xas demográficas devido à pequena populaçãodas áreas leva a grande erro relativo. Em geral,os métodos atualmente empregados não con-sideram a estrutura espacial subjacente no pro-cesso demográfico. Parece ser possível fazeruma extensão do método exposto aqui para es-se problema e este é um dos problemas com oqual nos ocuparemos. Em geral, qualquer pro-blema onde taxas são calculadas para muitasáreas contíguas e com populações pequenaspoderia se beneficiar desta metodologia.

Page 11: Mapas de taxas epidemiológicas: uma abordagem Bayesiana ... · Emília Sakurai 1 Abstract This article presents statistical methods recently developed for the analysis of maps of

MAPAS DE TAXAS EPIDEMIOLÓGICAS 723

Cad. Saúde Pública, Rio de Janeiro, 14(4):713-723, out-dez, 1998

BESAG, J. & GREEN, P. J., 1993. Spatial Statistics andBayesian computation. Journal of the Royal Sta-tistical Society, 55:25-37.

BESAG, J.; YORK, J. & MOLLIÉ, A., 1991. Bayesian im-age restoration, with applications in spatial sta-tistics (with discussion). Annals of the Institute ofStatistical Mathematics, 43:1-59.

CHOYNOWSKI, M., 1959. Maps based on probabili-ties. Journal of the American Statistical Associa-tion, 54:385-388.

CLAYTON, D. 1989. Hierarchical Bayesian models indescriptive epidemiology. Proceedings of the XIVthInternational Biometrics Conference, 201-213.

CLAYTON, D. & KALDOR, J., 1987. Empirical Bayesestimates of age-standardized relative risks foruse in disease mapping. Biometrics, 43:671-681.

CRESSIE, N., 1991. Statistics for Spatial Data. Chich-ester: John Wiley & Sons.

GLASS, G. E.; SCHWARTZ, B. S.; MORGAN, J. M.;JOHNSON, D. T.; NOY, P. M. & ISRAEL, E., 1995.Environmental risk factors for Lyme disease iden-tified with geographic information systems.American Journal of Public Health, 85:944-948.

DIGGLE, P. J.; GATRELL, A. C. & LOVETT, A. A., 1990.Modelling the prevalence of cancer of cancer oflarynx in part of Lancashire: a new methodologyfor spatial epidemiology. In: Spatial Epidemiolo-gy (R. W. Thomas, ed.), pp. 153-171. Pion: London.

ELLIOTT, P. J.; HILLS, M.; BERESFORD, J.; KLEIN-SCHMIDT, I.; JOLLEY, D.; PATTENDEN, S.; RO-DRIGUES, L.; WESTLAKE, A. & ROSE, G., 1992. In-cidence of cancer of the larynx and lung cancernear incinerators of waste solventes and oil inGreat Britain. The Lancet, 339:854-858.

HOOVER, R. N. & STRASSER, P. H., 1980. Artificialsweeteners and human bladder cancer: prelimi-nary results. Lancet, 1:837-840.

LEHMAN, E. L., 1983. Theory of Point Estimation.New York: John Wiley & Sons.

MANTON, K. G.; WOODBURY, M. A.; STALLARD, E.;RIGGAN, W. B.; CREASON, J. P. & PELLOM, A. C.,1989. Empirical bayes procedures for stabilizingmaps of U.S. cancer mortality rates. Journal of theAmerican Statistical Association, 84:637-650.

MASON, T. J., 1995. The development of the series ofU.S. cancer atlases: implications for the futureepidemilogic research. Statistics in Medicine, 14:473-479.

MASON, T. J.; McKAY, F. W.; HOOVER, R.; BLOT, W. J. &FRAUMENI Jr., J. F., 1975. Atlas of Cancer Mortali-ty for U.S. Counties, 1950-1969. Washington: De-partment of Health, Education, and Welfare Pub-lication 75-780, U.S. Government Printing Office.

MASON, T. J.; McKAY, F. W.; HOOVER, R.; BLOT, W. J. &FRAUMENI Jr., J. F., 1976. Atlas of Cancer Mortali-ty among U.S. Nonwhites: 1950-1969. Washing-ton: Department of Health, Education, and Wel-fare Publication 76-1204, U.S. Government Print-ing Office.

PICKLE, L. W.; GREENE, M. H.; ZIEGLER, R. G.; TOLE-DO, A.; HOOVER, R.; LYNCH, H. T. & FRAUMENIJr., J. F, 1981. Colorectal cancer in rural Nebraska.Cancer Research, 44:363-369.

TSUTAKAWA, R. K., 1988. Mixed model for analysinggeographic variation in mortality rates. Journal ofthe American Statistical Association, 83:37-42.

TSUTAKAWA, R. K.; SHOOP, G. L. & MARIENFELD, C.J., 1985. Empirical bayes estimation of cancermortality rates. Statistics in Medicine, 4:201-212.

WINN, D. M.; BLOT, W. J.; SHY, C. M.; PICKLE, L. W.;TOLEDO, A. & FRAUMENI Jr., J. F., 1981. Snuffdipping and oral cancer among women in thesouthern United States. New England Journal ofMedicine, 304:745-749.

ZIEGLER, R. G.; MASON, T. J.; STEMHAGEN, A.;HOOVER, R.; SCHOENBERG, J. B.; VIRGO, P.;WALTMAN, R. & FRAUMENI Jr., J. F., 1984. Dietarycarotene and vitamin A and risk of lung canceramong white men in New Jersey. Journal of theNational Cancer Institute, 73:1429-1435.