Regresión de PoissonEn estadística, la regresión de Poisson es un tipo de modelo lineal generalizado en el que la variable de respuesta tiene una distribución de Poisson y el logaritmo de su valor esperado puede ser modelado por una combinación lineal de parámetros desconocidos, es decir, el logaritmo es la función de enlace canónica. Se usa para modelar datos de conteo (número de veces que ocurre cierto fenómeno aleatorio) y tablas de contingencia. Formulación matemáticaLa regresión de Poisson se utiliza para modelar fenómenos que pueden representarse mediante una variable aleatoria Y tal que para un valor de unas variables independientes,
es decir, el valor de Y condicionado a x sigue una distribución de Poisson de parámetro para ciertos valores y . En concreto, debido a las propiedades de la distribución de Poisson, el valor de la media predicha es
A veces, por abreviar, se escribe simplemente
donde x es un vector n+1-dimensional que consta de n variables independientes y una constante, usualmente 1. En este caso concreto, θ es simplemente a concatenado a b. Si Yi son observaciones independientes de la variable aleatoria Y , la estimación de θ suele realizarse utilizando el método de la máxima verosimilitud. Este estimador no admite una forma cerrada y debe calcularse mediante métodos numéricos. Como la superficie de probabilidad para este tipo de modelos es siempre convexa, el método de Newton u otros métodos basados en el gradiente son adecuados.[cita requerida] No obstante, los paquetes estadísticos habituales son capaces de realizar automáticamente el ajuste de este tipo de modelos. AplicacionesEl modelo de Poisson es apropiado cuando la variable dependiente es un conteo, como por ejemplo, el número de llamadas que llegan a una central telefónica, que dependen de otras variables como, por ejemplo el día de la semana o la hora del día. Los sucesos tienen que ser independientes.
ImplementacionesImplementaciones de este modelo existen en paquetes estadísticos tales como:
Ejemplo de ajuste de un modelo de Poisson con REl siguiente código muestra cómo ajustar mediante un modelo de regresión de Poisson un conjunto de datos recopilados por Dobson.[4][5] # Construcción de los datos
counts <- c(18,17,15,20,10,20,25,13,12)
outcome <- gl(3,1,9)
treatment <- gl(3,3)
# Ajuste del modelo
glm.D93 <- glm(counts ~ outcome + treatment, family=poisson())
# Resumen del modelo
anova(glm.D93)
summary(glm.D93)
Bibliografía
Referencias
|