Abstract: Implementación de un algoritmo para la detección de brotes aplicado a un sistema microbiológio

Speaker:   Esther López Vizcaíno

Introduccion

En un sistema de vigilancia pasiva de enfermedades infecciosas (en este caso problemas de salud definidos microbiológicamente) es importante la detección precoz de brotes a fin de poder establecer medidas de control. La detección de brotes en este tipo de sistemas es conceptualmente simple: número de microorganismos declarados por distintos laboratorios en una semana comparado con un umbral derivado de datos históricos.

Un algoritmo estadístico para el cálculo del valor umbral debe tener en cuenta las fluctuaciones en los datos debidas a ciclos estacionales, tendencia y brotes pasados, que varían de un microorganismo a otro. Además, el sistem a debe ser suficientemente robusto para ser aplicado a una gran variedad de microorganismos. Farrington et al. (1996) desarrollaron un algoritmo que tiene en cuenta estos factores, calculando el valor umbral mediante un modelo de regresión log-lin eal ajustado por sobredispersión, estacionalidad, tendencia y brotes pasados.

El objetivo de este trabajo es la adaptación a este sistema de vigilancia del modelo propuesto por Farrington et al. (1996). El paquete estadístico Stata 5.0 fue utilizado para el desarrollo del algoritmo.

Asumimos que los datos siguen una distribución de Poisson de media m i excepto cuando existe sobredispersión; en ese caso la media de la distribución de Poisson se supone distribuída de acuerdo a una Gamma con media m i y varianza m i(f -1), f parámetro de sobredispersión, lo que resulta en una Binomial-Negativa con media m i y varianza f m i. La componente sistemática del modelo es: ln m i =a +b ti +g ni, donde ti es la variable tiempo medida en semanas y ni es el número de hospitales en los que se produjeron los casos declarados. Asumimos también que existe correlación entre los datos de un mismo año, y que los datos de años distintos son independientes.

Descripción del algoritmo

Para cada uno de los microorganismos notificados se siguen los siguientes pasos:

Los datos históricos para estimar el modelo de regresión para la semana t0 son los correspondientes a las semanas t0-3 a t0+3 de los cinco años anteriores, resultando un total de 35 datos:

Año a
t0
Año a-1              
Año a-2              
Año a-3              
Año a-4              
Año a-5              

Se estima un modelo inicial utilizando poisson y se contrasta la sobredispersión de los datos.

Si hay sobredispersión, se estima un modelo de regresión Binomial-Negativa haciendo uso del ado ml con el métodolf para maximizar la función de verosimilitud y tomando como valores iniciales los obtenidos con el modelo de Poisson. Este nuevo modelo proporciona estimaciones iniciales y permite definir una función de ponderación que asigna pesos bajos a las observaciones atípicas. A continuación se reajusta el modelo teniendo en cuenta los pesos def inidos, y de este modo se corrige el efecto de posibles brotes pasados. En este modelo la correlación existente entre datos pertenecientes a un mismo año se corrigió en el cálculo del valor umbral.

En otro caso, se reestima el modelo de Poisson con poisml utilizando las opciones robust, que corrige el efecto de brotes pasados, y cluster, que tiene en cuenta la correlación existe nte entre los datos del mismo año.

En ambos casos, tanto en el modelo de Poisson como en el de la Binomial-Negativa, se contrasta la significación de la tendencia, de tal forma que si esta no es significativa se elimina del modelo y se repite la estimación sin esta variable.

En cada caso el ajuste del modelo nos proporciona una predicción por intervalo con una confianza del 97.5% para la semana t0. El valor umbral será el límite superior del intervalo de predicción.

El resultado final del algoritmo es una tabla con la siguienta estructura:

        ------------------------+-----------------------------------
                      Organismo |      Casos      Umbral       Brote
        ------------------------+-----------------------------------
                       A.caviae |          5        2.92       Brote
                  Aeromonas sp. |          0        0.02           -
                         C.coli |          4        8.78           -
                    C.difficile |          1        3.20           -
                      C.laridis |          0        2.18           -
              Campylobacter sp. |         16       24.16           -
               Y.enterocolitica |          8        8.53           -
        Y.enterocolitica ser.03 |          1        3.45           -
        ------------------------+-----------------------------------

Referencias

Biggeri, A. 1998.
Negative Binomial Distribution. In Encyclopedia of Biostatistics, Vol. 4. P. Armitage and T. Colton, eds. Wiley, 2962–2967.
Dean, C. B. 1998.
Overdispersion. In Encyclopedia of Biostatistics, Vol. 4. P. Armitage and T. Colton, eds. Wiley, 3226–3232.
Farrington, C.P. et al. 1996.
A Statistical Algorithm for ther Early Detection of Outbreaks of Infectious Disease. J. R. Statist. Soc. A 159: 547–563.
Gould, W. 1996.
ip13: Maximum likelihood estimation using the ml command. Stata Technical Bulletin 34: 10–21. Reprinted in Stata Technical Bulletin Reprints, vol 6, pp. 55–68.
Hilbe, J. 1998.
sg91: Robust variance estimators for MLE Poisson and negative binomial regression. Stata Technical Bulletin 45: 26–28.