La distribución de Gumbel es una distribución deprobabilidad de valores extremos.
En la teoría de la probabilidad y la estadística, la distribución de Gumbel se utiliza para modelar la distribución del máximo (o el mínimo) de un número de muestras de diversas distribuciones.
Una distribución de este tipo podría utilizarse para representar la distribución del nivel máximo de un río en un año concreto si se dispusiera de una lista de valores máximos de los últimos diez años. También es útil para predecir la probabilidad de que se produzca un terremoto extremo, una inundación u otra catástrofe natural.
Definición y fórmulas básicas
La forma más común de la distribución de Gumbel (para máximos) tiene dos parámetros: μ (ubicación) y β > 0 (escala). Sus funciones son:
- Función de distribución acumulada (CDF): F(x) = exp(-exp(-(x - μ)/β)).
- Densidad de probabilidad (PDF): f(x) = (1/β) · exp(-z - exp(-z)), donde z = (x - μ)/β.
La forma estandarizada (μ = 0, β = 1) se conoce como la Gumbel estándar.
Propiedades importantes
- Media: E[X] = μ + γ β, donde γ ≈ 0.5772156649 es la constante de Euler–Mascheroni.
- Varianza: Var(X) = (π² / 6) β².
- Asimetría (skewness): ≈ 1.139547 (valor positivo, cola derecha más pesada que la izquierda en sentido relativo).
- Curtosis en exceso: ≈ 2.4 (cola más pesada que la normal, pero no tan pesada como distribuciones con cola algebraica).
- Comportamiento de cola: la cola derecha decrece exponencialmente; por tanto, no es adecuada para modelar fenómenos con colas muy pesadas (colas algebraicas).
Relación con otras distribuciones y teoría de extremos
- La distribución de Gumbel es uno de los tres tipos límites en la teoría de valores extremos y corresponde al caso con parámetro de forma ξ = 0 de la distribución generalizada de valores extremos (GEV). Es el llamado tipo I de Fisher–Tippett.
- La Gumbel para mínimos se obtiene cambiando de signo la variable: si X tiene Gumbel para máximos, entonces -X tiene Gumbel para mínimos (o aplicando la transformación adecuada en la CDF).
- Se relaciona con la distribución doble exponencial (o Laplace) en ciertas transformaciones, pero no son idénticas.
Estimación y ajuste a datos
Para ajustar una distribución de Gumbel a datos se usan métodos como:
- Máxima verosimilitud (MLE): método habitual y eficiente para muestras moderadas/grandes.
- Método de los momentos: utiliza media y varianza muestrales para obtener μ y β aproximados.
- L-momentos: recomendadas en hidrología y análisis de extremos por su robustez frente a valores atípicos y su buen comportamiento en muestras pequeñas.
Para evaluar la bondad de ajuste conviene usar gráficos Q–Q, pruebas como Anderson–Darling o Kolmogorov–Smirnov, y análisis de residuales. En fenómenos con colas pesadas, comparar con alternativas (p. ej. GEV con ξ ≠ 0, Pareto) es aconsejable.
Aplicaciones prácticas
- Hidrología: cálculo de caudales máximos, niveles de crecida, diseño de diques y presas.
- Meteorología y climatología: velocidades máximas del viento, precipitaciones extremas, temperaturas máximas.
- Ingeniería: resistencia máxima de materiales, cargas extremas, seguridad estructural frente a eventos raros.
- Gestión de riesgos y seguros: estimación de pérdidas máximas en horizontes temporales determinados (aunque en finanzas suele preferirse modelos con colas más pesadas).
- Otras ciencias: sismología (al estudiar la distribución de magnitudes máximas en ventanas temporales), oceanografía (altura máxima de olas), etc.
Cómo simular datos Gumbel
Si U es una variable uniforme en (0,1), una simulación de Gumbel se obtiene por la transformación inversa:
X = μ - β · ln(-ln(U)).
Limitaciones y consideraciones
- La Gumbel asume que la cola del máximo tiene decaimiento de tipo exponencial; no sirve bien cuando los datos muestran colas pesadas (colas algebraicas).
- El tamaño de muestra y la independencia de las observaciones (o al menos el tratamiento de dependencia temporal) afectan la estimación y las inferencias.
- En la práctica conviene comparar varios modelos de valores extremos (p. ej. GEV con ξ estimado) y realizar análisis de sensibilidad a la elección del umbral o al periodo de retorno.
Ejemplo ilustrativo
Si se ajusta una Gumbel con parámetros μ = 10 y β = 2 para modelar niveles máximos anuales, la probabilidad de que el nivel supere 16 en un año es:
P(X > 16) = 1 - F(16) = 1 - exp(-exp(-(16 - 10)/2)) ≈ 1 - exp(-exp(-3)) ≈ 1 - exp(-0.0498) ≈ 0.0487 (≈ 4.9%).
En resumen, la distribución de Gumbel es una herramienta central en el análisis de valores extremos, muy útil para estimar probabilidades y periodos de retorno de eventos raros cuando la cola se comporta de forma exponencial. Su uso requiere comprobar suposiciones, comparar modelos y aplicar métodos de estimación adecuados al tamaño y características de los datos.





