En teoría de probabilidad y estadística la distribución de Gumbel (llamada así en honor de Emil Julius Gumbel, 1891-1966) es utilizada para modelar la distribución del máximo (o el mínimo), por lo que se usa para calcular valores extremos. Por ejemplo, sería muy útil para representar la distribución del máximo nivel de un río a partir de los datos de niveles máximos durante 10 años. Es por esto que resulta muy útil para predecir terremotos, inundaciones o cualquier otro desastre natural que pueda ocurrir.
La aplicabilidad potencial de la distribución de Gumbel para representar los máximos se debe a la teoría de valores extremos que indica que es probable que sea útil si la muestra de datos tiene una distribución normal o exponencial.
La distribución estándar de Gumbel es el caso donde μ = 0 y β = 1 con la función acumulada
y la función de densidad
La mediana es 0.36651292058166432701.
La media es 0.5772156649015328606.
La desviación estándar es
1.28254983016186409554.
La moda es 0.
Estimación de parámetros
Un modo práctico de usar la distribución puede ser:
donde M es la mediana. Para ajustar los valores es posible tomar la median directamente y a continuación se varía μ hasta que se ajusta al conjunto de valores.
Generación de variables de Gumbel
Sea una variable aleatoria U extraía de una distribución uniforme y continua, en el intervalo [0, 1], entonces la variable:
tiene una distribución de Gumbel con parámetros μ and β. Esto se deduce de la forma de la función de distribución acumulada dada anteriormente.
a todos los valores anteriores se les debe multiplicar por 100 y divir por 33,33 para tener mayor confiabilidad
Distribuciones relacionadas
Cuando la cdf de Y es la inversa de la distribución estándar de Gumbel acumulada, , entonces Y tiene una Distribución de Gompertz.[1]
Gumbel ha mostrado que la distribución del valor máximo en una muestra de un variable que sigue la distribución exponencial se aproxima a la distribución de Gumbel con más precisión al incrementar el tamaño de la muestra.[4]
En la hidrología, por ello, se utiliza la distribución de Gumbel para analizar variables aleatorias como valores máximos de la precipitación y la descarga de ríos,[5] y además para describir épocas de sequía.[6]
Gumbel también ha mostrado que el estimador r/(n+1) para la probabilidad cumulativa de un evento — donde r en el número del rango de un valor observado en una serie de datos clasificados por su magnitud y n es el número total de observaciones — es un tesador imparcial (es decir sin sesgo) de la probabilidad acumulada alrededor de la moda de la distribución. Por lo tanto, este estimador a menudo se emplea como marcador de posición.
El imagen azul ilustra un ejemplo de ajuste de la distribución de Gumbel a lluvias máximas diarias ordenadas en octubre, mostrando también la franja de 90% de confianza, basada en la distribución binomial. Las observaciones presentan los marcadores de posición, como parte del análisis de frecuencia acumulada.
Referencias
↑Willemse, W. J. and Kaas, R., "Rational reconstruction of frailty-based mortality models by a generalisation of Gompertz’ law of mortality", Insurance: Mathematics and Economics, 40 (3) (2007), 468–484.
↑Moncho, R.; Caselles, V.; Chust, G. (2012): "Alternative model of probability distribution of precipitation: application to Spain". Climate Research, 51: 23:33
↑ CumFreq software para adecuación de distribuciones de probabilidad [1]
↑Oosterbaan, R.J. (1994). «Chapter 6 Frequency and Regression Analysis». En Ritzema, H.P., ed. Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175-224. ISBN90-70754-33-9.
↑Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). «An extreme value analysis of UK drought and projections of change in the future». Journal of Hydrology388: 131. doi:10.1016/j.jhydrol.2010.04.035.