En estadística, un intervalo de confianza es una forma especial de estimar un determinado parámetro. Con este método se ofrece un rango (intervalo) de valores plausibles para el parámetro en lugar de un único valor puntual, acompañado de una probabilidad asociada a que el valor verdadero (desconocido) se encuentre dentro de ese rango. Esa probabilidad se denomina nivel de confianza y suele indicarse en forma de porcentaje (por ejemplo, "intervalo de confianza del 95%"). Los extremos del intervalo se conocen como límites de confianza. Para un mismo procedimiento, cuanto mayor es el nivel de confianza, mayor será la amplitud del intervalo.

El cálculo de un intervalo de confianza suele requerir suposiciones sobre la naturaleza del proceso de estimación: se trata principalmente de un método paramétrico. Un supuesto habitual es que la distribución de la población de la que procede la muestra es normal, o que el tamaño muestral sea suficiente para invocar aproximaciones asintóticas. Por ello, los intervalos de confianza clásicos no son siempre robustos frente a supuestos violados; en esos casos se usan alternativas (p. ej., métodos no paramétricos o bootstrap) para aumentar la robustez.

Interpretación correcta

  • Un intervalo de confianza del 95% no significa que exista una probabilidad del 95% de que el parámetro verdadero esté en el intervalo calculado a partir de una muestra dada. La interpretación frecuentista es: si repitiésemos el mismo procedimiento de muestreo muchas veces y construyéramos un intervalo de confianza del 95% en cada experimento, aproximadamente el 95% de esos intervalos contendrían el verdadero parámetro.
  • Para un intervalo ya calculado, el parámetro es fijo (pero desconocido) y el intervalo es aleatorio; no tiene sentido asignar probabilidades puramente frecuentistas al parámetro sin usar un marco bayesiano.

Cálculo: fórmulas básicas

Los límites de un intervalo de confianza general se escriben como: estimador puntual ± (valor crítico) × (error estándar).

  • Media poblacional, sigma conocido: x̄ ± z_{α/2} · (σ / √n)
    Donde z_{α/2} es el cuantíl de la normal estándar para el nivel de confianza (por ejemplo, z_{0.025}=1.96 para 95%).
  • Media poblacional, sigma desconocido: x̄ ± t_{n-1, α/2} · (s / √n)
    Se usa la distribución t de Student con n−1 grados de libertad y s es la desviación estándar muestral.
  • Proporción poblacional: p̂ ± z_{α/2} · √( p̂(1−p̂) / n )
    Para p̂ cerca de 0 o 1 o n pequeño, conviene usar correcciones (Wilson, Agresti–Coull) o el método exacto de Clopper–Pearson.
  • Una cola (intervalo unilateral): x̄ ± z_{α} · (σ / √n) (usar z_{α} correspondiente).

Ejemplos prácticos

Ejemplo 1 — Media con sigma desconocido:

Supongamos una muestra de n = 25 observaciones con media muestral x̄ = 100 y desviación típica muestral s = 15. Queremos un intervalo de confianza del 95% para la media poblacional.

Valor crítico t_{24,0.025} ≈ 2.064. Error estándar = s / √n = 15 / 5 = 3. Entonces el intervalo es: 100 ± 2.064 × 3 = 100 ± 6.192, es decir (93.81, 106.19).

Ejemplo 2 — Proporción:

De una muestra de n = 200 individuos, 120 manifiestan estar a favor de una propuesta, de modo que p̂ = 120/200 = 0.60. Para un 95% de confianza, z_{0.025} = 1.96.

Error estándar = √(0.60·0.40 / 200) = √(0.24 / 200) ≈ 0.03464. Margen de error = 1.96 × 0.03464 ≈ 0.0679. Intervalo: 0.60 ± 0.0679 → (0.532, 0.668).

Elección del nivel de confianza y del tamaño de muestra

Factores que influyen en la amplitud del intervalo:

  • Nivel de confianza: mayor nivel → mayor z o t → intervalo más amplio.
  • Variabilidad de los datos (σ o s): mayor variabilidad → intervalo más amplio.
  • Tamaño de la muestra n: mayor n → error estándar más pequeño → intervalo más estrecho.

Para calcular el tamaño de muestra necesario para una precisión deseada (margen de error E):

  • Para una media (σ conocida aproximada): n = (z_{α/2} · σ / E)^2, redondear hacia arriba.
  • Para una proporción: n = z_{α/2}^2 · p(1−p) / E^2. Si no se conoce p, usar p = 0.5 para obtener el n máximo conservador.

Supuestos, limitaciones y alternativas

  • Supuestos comunes: muestreo aleatorio, independencia entre observaciones y distribución adecuada (normalidad para muestras pequeñas en la estimación de medias).
  • Si los supuestos no se cumplen: considerar transformaciones (por ejemplo, log), métodos robustos o el bootstrap (intervalos de percentiles, BCa) que no dependen fuertemente de la normalidad.
  • Para proporciones y conteos pequeños o rarezas, usar métodos exactos (Clopper–Pearson) o intervalos basados en la distribución binomial/Poisson.

Errores y malentendidos frecuentes

  • Interpretar el intervalo como una probabilidad sobre el parámetro en el sentido individual (ver sección de interpretación).
  • Creer que un intervalo más estrecho siempre significa mejor: si se reduce n o se suavizan supuestos, un intervalo estrecho puede ser engañoso.
  • Omitir reportar el nivel de confianza o el tamaño de la muestra junto con el intervalo.

Consejos prácticos al informar intervalos de confianza

  • Informe siempre: estimador puntual, intervalo (con límites numéricos), nivel de confianza y n.
  • Si usa aproximaciones (z en vez de t) indique la razón (p. ej., n grande).
  • Incluya gráficos (barras de error, intervalos en gráficas de coeficientes) para facilitar la interpretación.
  • Si los supuestos pueden estar violados, presente un intervalo alternativo (por ejemplo, bootstrap) o realice análisis de sensibilidad.

En resumen, los intervalos de confianza son una herramienta útil para expresar la incertidumbre de una estimación. Entender sus supuestos, interpretarlos correctamente y complementar con métodos robustos cuando haga falta mejora la calidad de la inferencia estadística.