Teorema del Límite Central: definición, propiedades y ejemplos
Descubre el Teorema del Límite Central: definición, propiedades y ejemplos prácticos para entender por qué la suma de variables aleatorias converge a la distribución normal.
En la teoría de la probabilidad y la estadística, los teoremas del límite central, abreviados como CLT, son teoremas que describen los comportamientos límite de las distribuciones de probabilidad cuando se agregan muchas variables aleatorias. Informalmente, dicen que la suma (o la media) de un gran número de variables aleatorias independientes y con varianza finita tiende a una distribución estable; en la mayoría de las formulaciones habituales esta distribución límite es la distribución gaussiana (o normal). Esta propiedad explica por qué la normal aparece con tanta frecuencia en la práctica.
Enunciado clásico (i.i.d.)
El más conocido de estos resultados afirma lo siguiente para variables independientes e idénticamente distribuidas. Más concretamente, si son n variables aleatorias idénticas y distribuidas independientemente con media μ
y desviación estándar σ
, entonces la distribución de su media muestral,
, a medida que n es grande, es aproximadamente normal con una media μ
y una desviación estándar σ
.
De forma equivalente, la suma , cuando n crece, también es aproximadamente normal con media
y desviación estándar
.
Intuición y comentarios sobre la convergencia
- El teorema establece convergencia en distribución hacia la normal; no implica que las distribuciones exactas sean exactamente normales para n finito, sino que se acercan a la normal cuando n → ∞.
- Para distribuciones originales que son «bien comportadas» (simétricas, con colas finitas), la aproximación suele ser buena incluso para n moderados. Si la distribución de partida es muy asimétrica o con colas pesadas, pueden requerirse n mucho mayores.
- Si las variables no tienen varianza finita (por ejemplo, colas muy pesadas), el límite puede ser otra familia de distribuciones estables (leyes de Lévy α‑estables) en lugar de la normal.
Condiciones y generalizaciones
Existen varias versiones del CLT que debilitan la hipótesis de variables idénticamente distribuidas o de independencia completa. Algunas generalizaciones importantes son:
- Condición de Lindeberg: permite variables independientes no idénticas siempre que ninguna variable individual aporte desproporcionadamente a la varianza total; asegura que la suma normalizada converge a la normal.
- Condición de Lyapunov: una condición más fuerte (pero más fácil de verificar en algunos casos) que implica la condición de Lindeberg; requiere el control de momentos de orden 2+δ para algún δ>0.
- Existen extensiones para series con cierta dependencia débil (mezclas) y para procesos estacionarios bajo condiciones técnicas.
Propiedades importantes
- El centro y la escala del límite están determinados por la suma de las medias y varianzas: la media de la suma es suma de medias, y la varianza de la suma es la suma de varianzas (si las variables son independientes).
- El teorema permite obtener approximaciones normales para estadísticas complejas que se pueden expresar (o aproximar) como suma de contributions independientes: por ejemplo, la media muestral, proporciones, y ciertos estimadores.
- Existen resultados cuantitativos sobre la velocidad de convergencia, por ejemplo el teorema de Berry–Esseen, que da cotas en función del tercer momento.
Ejemplos sencillos
- Monedas: si X_i indica 1 para cara y 0 para cruz (Bernoulli(p)), entonces la media muestral X̄ tiene media p y desviación estándar sqrt(p(1−p)/n). Por ejemplo, con p=0.6 y n=100 la desviación estándar de X̄ es sqrt(0.24/100) ≈ 0.049, de modo que X̄ ≈ N(0.6, 0.049).
- Dados: la suma de n tiradas de un dado justo tiende a una normal. Para un solo dado, media 3.5 y varianza 35/12; para n tiradas la media de la suma es 3.5n y la desviación estándar es sqrt(n·35/12).
- Distribución uniforme(0,1): cada X_i tiene media 1/2 y varianza 1/12; así la media muestral para gran n es aproximadamente N(1/2, (1/12)/n).
Aplicaciones prácticas
- Construcción de intervalos de confianza y pruebas de hipótesis basadas en la aproximación normal de la estadística muestral.
- Control de calidad y muestreo industrial: permite predecir variaciones y establecer límites de tolerancia.
- Modelos agregados en economía, ciencias sociales y naturales: cuando muchas pequeñas fuentes independientes afectan un resultado, la normal surge como aproximación razonable.
Limitaciones y precauciones
- No garantiza que la aproximación sea buena para muestras pequeñas; la rapidez de convergencia depende de la forma de la distribución original.
- No describe el comportamiento de colas extremas ni de máximos; para eventos raros o colas pesadas, puede ser inadecuado.
- Requiere, en las versiones más simples, independencia y varianza finita; si estas hipótesis fallan, hay que usar versiones generalizadas o teorías alternativas.
Breve nota histórica
El nombre «teorema del límite central» se relaciona con artículos clásicos sobre el tema; en particular, se menciona un artículo de George Pólya de 1920, Sobre el teorema del límite central en la teoría de la probabilidad y el problema del momento. Precursores importantes son Abraham de Moivre y Pierre‑Simon Laplace, y más tarde contribuyeron Lindeberg, Lyapunov y Lévy, entre otros.
En resumen, el teorema del límite central es una de las piedras angulares de la estadística matemática: explica la ubiquidad de la distribución normal al agregar muchas contribuciones aleatorias y proporciona la base teórica para numerosos métodos estadísticos aplicados.
Páginas relacionadas
Preguntas y respuestas
P: ¿Qué es el Teorema Central del Límite?
R: El Teorema Central del Límite (CLT) es un teorema sobre los comportamientos límite de las distribuciones de probabilidad agregadas. Afirma que dado un gran número de variables aleatorias independientes, su suma seguirá una distribución estable. Si la varianza de las variables aleatorias es finita, entonces resultará una distribución gaussiana.
P: ¿Quién escribió el artículo en el que se basó este teorema?
R: George Pَlya escribió el artículo "Sobre el teorema central del límite en la teoría de la probabilidad y el problema del momento" en 1920, que sirvió de base para este teorema.
P: ¿Qué tipo de distribución resulta cuando todas las variables aleatorias tienen varianza finita?
R: Cuando todas las variables aleatorias tienen varianza finita, al aplicar la CLT resultará una distribución gaussiana o normal.
P: ¿Existen generalizaciones de la CLT?
R: Sí, existen diferentes generalizaciones de la CLT que ya no requieren una distribución idéntica de todas las variables aleatorias. Estas generalizaciones incluyen las condiciones de Lindeberg y Lyapunov, que garantizan que ninguna variable aleatoria tenga más influencia que otras en el resultado.
P: ¿Cómo funcionan estas generalizaciones?
R: Estas generalizaciones garantizan que ninguna variable aleatoria tenga más influencia que otras en el resultado introduciendo condiciones previas adicionales como las condiciones de Lindeberg y Lyapunov.
P: ¿Qué dice la CLT sobre la media muestral y la suma de un gran número de variables aleatorias independientes con la misma distribución?
R: Según CLT, si n variables aleatorias idénticas e independientemente distribuidas con una media ى {\mu} y una desviación estándar َ {\sigma} , entonces su media muestral (X1+...+Xn)/n será aproximadamente normal con media ى {\displaystyle \mu } y desviación típica َ/√n {\displaystyle {\tfrac {\sigma }{sqrt {n}}}} . Además, su suma X1+...+Xn también será aproximadamente normal con media nى {\displaystyle n\mu } y desviación típica √nَ {\displaystyle {\sqrt {n}\sigma } .
Buscar dentro de la enciclopedia