Intervalo de confianza: definición, cálculo y ejemplos prácticos
Intervalo de confianza: definición clara, cálculo paso a paso y ejemplos prácticos para interpretar niveles (95%), errores y aplicaciones en estadística.
En estadística, un intervalo de confianza es una forma especial de estimar un determinado parámetro. Con este método se ofrece un rango (intervalo) de valores plausibles para el parámetro en lugar de un único valor puntual, acompañado de una probabilidad asociada a que el valor verdadero (desconocido) se encuentre dentro de ese rango. Esa probabilidad se denomina nivel de confianza y suele indicarse en forma de porcentaje (por ejemplo, "intervalo de confianza del 95%"). Los extremos del intervalo se conocen como límites de confianza. Para un mismo procedimiento, cuanto mayor es el nivel de confianza, mayor será la amplitud del intervalo.
El cálculo de un intervalo de confianza suele requerir suposiciones sobre la naturaleza del proceso de estimación: se trata principalmente de un método paramétrico. Un supuesto habitual es que la distribución de la población de la que procede la muestra es normal, o que el tamaño muestral sea suficiente para invocar aproximaciones asintóticas. Por ello, los intervalos de confianza clásicos no son siempre robustos frente a supuestos violados; en esos casos se usan alternativas (p. ej., métodos no paramétricos o bootstrap) para aumentar la robustez.
Interpretación correcta
- Un intervalo de confianza del 95% no significa que exista una probabilidad del 95% de que el parámetro verdadero esté en el intervalo calculado a partir de una muestra dada. La interpretación frecuentista es: si repitiésemos el mismo procedimiento de muestreo muchas veces y construyéramos un intervalo de confianza del 95% en cada experimento, aproximadamente el 95% de esos intervalos contendrían el verdadero parámetro.
- Para un intervalo ya calculado, el parámetro es fijo (pero desconocido) y el intervalo es aleatorio; no tiene sentido asignar probabilidades puramente frecuentistas al parámetro sin usar un marco bayesiano.
Cálculo: fórmulas básicas
Los límites de un intervalo de confianza general se escriben como: estimador puntual ± (valor crítico) × (error estándar).
- Media poblacional, sigma conocido: x̄ ± z_{α/2} · (σ / √n)
Donde z_{α/2} es el cuantíl de la normal estándar para el nivel de confianza (por ejemplo, z_{0.025}=1.96 para 95%). - Media poblacional, sigma desconocido: x̄ ± t_{n-1, α/2} · (s / √n)
Se usa la distribución t de Student con n−1 grados de libertad y s es la desviación estándar muestral. - Proporción poblacional: p̂ ± z_{α/2} · √( p̂(1−p̂) / n )
Para p̂ cerca de 0 o 1 o n pequeño, conviene usar correcciones (Wilson, Agresti–Coull) o el método exacto de Clopper–Pearson. - Una cola (intervalo unilateral): x̄ ± z_{α} · (σ / √n) (usar z_{α} correspondiente).
Ejemplos prácticos
Ejemplo 1 — Media con sigma desconocido:
Supongamos una muestra de n = 25 observaciones con media muestral x̄ = 100 y desviación típica muestral s = 15. Queremos un intervalo de confianza del 95% para la media poblacional.
Valor crítico t_{24,0.025} ≈ 2.064. Error estándar = s / √n = 15 / 5 = 3. Entonces el intervalo es: 100 ± 2.064 × 3 = 100 ± 6.192, es decir (93.81, 106.19).
Ejemplo 2 — Proporción:
De una muestra de n = 200 individuos, 120 manifiestan estar a favor de una propuesta, de modo que p̂ = 120/200 = 0.60. Para un 95% de confianza, z_{0.025} = 1.96.
Error estándar = √(0.60·0.40 / 200) = √(0.24 / 200) ≈ 0.03464. Margen de error = 1.96 × 0.03464 ≈ 0.0679. Intervalo: 0.60 ± 0.0679 → (0.532, 0.668).
Elección del nivel de confianza y del tamaño de muestra
Factores que influyen en la amplitud del intervalo:
- Nivel de confianza: mayor nivel → mayor z o t → intervalo más amplio.
- Variabilidad de los datos (σ o s): mayor variabilidad → intervalo más amplio.
- Tamaño de la muestra n: mayor n → error estándar más pequeño → intervalo más estrecho.
Para calcular el tamaño de muestra necesario para una precisión deseada (margen de error E):
- Para una media (σ conocida aproximada): n = (z_{α/2} · σ / E)^2, redondear hacia arriba.
- Para una proporción: n = z_{α/2}^2 · p(1−p) / E^2. Si no se conoce p, usar p = 0.5 para obtener el n máximo conservador.
Supuestos, limitaciones y alternativas
- Supuestos comunes: muestreo aleatorio, independencia entre observaciones y distribución adecuada (normalidad para muestras pequeñas en la estimación de medias).
- Si los supuestos no se cumplen: considerar transformaciones (por ejemplo, log), métodos robustos o el bootstrap (intervalos de percentiles, BCa) que no dependen fuertemente de la normalidad.
- Para proporciones y conteos pequeños o rarezas, usar métodos exactos (Clopper–Pearson) o intervalos basados en la distribución binomial/Poisson.
Errores y malentendidos frecuentes
- Interpretar el intervalo como una probabilidad sobre el parámetro en el sentido individual (ver sección de interpretación).
- Creer que un intervalo más estrecho siempre significa mejor: si se reduce n o se suavizan supuestos, un intervalo estrecho puede ser engañoso.
- Omitir reportar el nivel de confianza o el tamaño de la muestra junto con el intervalo.
Consejos prácticos al informar intervalos de confianza
- Informe siempre: estimador puntual, intervalo (con límites numéricos), nivel de confianza y n.
- Si usa aproximaciones (z en vez de t) indique la razón (p. ej., n grande).
- Incluya gráficos (barras de error, intervalos en gráficas de coeficientes) para facilitar la interpretación.
- Si los supuestos pueden estar violados, presente un intervalo alternativo (por ejemplo, bootstrap) o realice análisis de sensibilidad.
En resumen, los intervalos de confianza son una herramienta útil para expresar la incertidumbre de una estimación. Entender sus supuestos, interpretarlos correctamente y complementar con métodos robustos cuando haga falta mejora la calidad de la inferencia estadística.
Significado del término "confianza"
El término confianza tiene un significado similar en estadística, como en el uso común. En el uso común, una afirmación del 95% de confianza en algo se toma normalmente como una indicación de certeza virtual. En estadística, una afirmación del 95% de confianza significa simplemente que el investigador ha visto un intervalo posible de un gran número de posibles, de los cuales diecinueve de veinte intervalos contienen el verdadero valor del parámetro.
Ejemplo práctico

Una máquina llena tazas con margarina. En el ejemplo, la máquina se ajusta para que el contenido de los vasos sea de 250 g de margarina. Como la máquina no puede llenar cada vaso exactamente con 250g, el contenido añadido a los vasos individuales muestra cierta variación, y se considera una variable aleatoria X. Se supone que esta variación se distribuye normalmente alrededor de la media deseada de 250g, con una desviación estándar de 2,5g. Para determinar si la máquina está adecuadamente calibrada, se elige al azar una muestra de n = 25 vasos de margarina y se pesan los vasos. Los pesos de la margarina son X 1, ..., X 25, una muestra aleatoria de X.
Para tener una impresión de la expectativa μ, basta con dar una estimación. El estimador adecuado es la media muestral:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={barra {X}}={frac {1}{n}}suma _{i=1}^{n}X_{i}. }
La muestra muestra los pesos reales x 1, ...,x 25, con la media:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gramos . {\displaystyle {\bar {x}}={\frac {1}{25}}suma _{i=1}^{25}x_{i}=250,2{\text}}. }
Si tomamos otra muestra de 25 tazas, podríamos esperar fácilmente encontrar valores como 250,4 o 251,1 gramos. Sin embargo, un valor medio de la muestra de 280 gramos sería extremadamente raro si el contenido medio de las tazas se aproxima de hecho a los 250 gramos. Existe todo un intervalo en torno al valor observado de 250,2 de la media muestral dentro del cual, si la media de toda la población toma realmente un valor en este rango, los datos observados no se considerarían especialmente inusuales. Dicho intervalo se denomina intervalo de confianza para el parámetro μ. ¿Cómo calculamos dicho intervalo? Los puntos finales del intervalo deben calcularse a partir de la muestra, por lo que son estadísticos, funciones de la muestra X 1, ..., X 25y, por tanto, variables aleatorias en sí mismas.
En nuestro caso podemos determinar los puntos finales considerando que la media muestral X de una muestra normalmente distribuida también lo está, con la misma expectativa μ, pero con error estándar σ/√n = 0,5 (gramos). Al estandarizar obtenemos una variable aleatoria
Z = X ¯ - μ σ / n = X ¯ - μ 0,5 {\displaystyle Z={{frac {{barra {X}}-\mu }{sigma /{cuadrado {n}}}}={frac {{barra {X}}-\mu }{0,5}}
dependiente del parámetro μ a estimar, pero con una distribución normal estándar independiente del parámetro μ. Por lo tanto, es posible encontrar números -z y z, independientes de μ, en los que Z se encuentra entre ambos con probabilidad 1 - α, una medida de la confianza que queremos tener. Tomamos 1 - α = 0,95. Así que tenemos:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95,}
El número z se deduce de la función de distribución acumulativa:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{tfrac {{alpha }{2}}=0,975,\\\\tfrac[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}
y obtenemos:
0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ X ¯ + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{barra {X}}-\mu }{sigma /{\sqrt {n}}}}\leq 1.96\a la derecha)&=P\a la izquierda({{barra {X}}-1,96{frac {{sigma}} {{cuadrado {n}}leq \a la barra {X}}+1.96 {\frac {\sigma}{cuadrado {n}}derecha)&=P\left({barra {X}}-1,96\times 0,5\leq \mu \leq {barra {X}+1.96 veces 0,5 a la derecha).
Esto podría interpretarse como: con probabilidad 0,95 encontraremos un intervalo de confianza en el que nos encontraremos con el parámetro μ entre los puntos finales estocásticos
X ¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}\\a},}
y
X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98,}
Esto no significa que haya un 0,95 de probabilidad de encontrar el parámetro μ en el intervalo calculado. Cada vez que se repitan las mediciones, habrá otro valor para la media X de la muestra. En el 95% de los casos μ estará entre los puntos finales calculados a partir de esta media, pero en el 5% de los casos no lo estará. El intervalo de confianza real se calcula introduciendo los pesos medidos en la fórmula. Nuestro intervalo de confianza del 0,95 se convierte en:
( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
Como el valor deseado 250 de μ está dentro del intervalo de confianza resultante, no hay razón para creer que la máquina está mal calibrada.
El intervalo calculado tiene puntos finales fijos, donde μ puede estar en medio (o no). Por lo tanto, este evento tiene una probabilidad de 0 o 1. No podemos decir: "con probabilidad (1 - α) el parámetro μ se encuentra en el intervalo de confianza". Sólo sabemos que por repetición en el 100(1 - α) % de los casos μ estará en el intervalo calculado. Sin embargo, en el 100α % de los casos no lo está. Y desgraciadamente no sabemos en cuál de los casos ocurre esto. Por eso decimos: "con un nivel de confianza del 100(1 - α) %, μ se encuentra en el intervalo de confianza. "
La figura de la derecha muestra 50 realizaciones de un intervalo de confianza para una media poblacional dada μ. Si elegimos al azar una realización, la probabilidad es del 95% de que acabemos eligiendo un intervalo que contenga el parámetro; sin embargo, podemos tener mala suerte y haber elegido el equivocado. Nunca lo sabremos; nos quedamos con nuestro intervalo.

Los segmentos de líneas verticales representan 50 realizaciones de un intervalo de confianza para μ.
Preguntas y respuestas
P: ¿Qué es un intervalo de confianza en estadística?
R: Un intervalo de confianza es un intervalo especial que se utiliza para estimar un parámetro, como la media de la población, dando un rango de valores aceptables para el parámetro en lugar de un valor único.
P: ¿Por qué se utiliza un intervalo de confianza en lugar de un valor único?
R: Se utiliza un intervalo de confianza en lugar de un valor único para tener en cuenta la incertidumbre de estimar un parámetro basándose en una muestra, y para dar una probabilidad de que el valor real del parámetro se encuentre dentro del intervalo.
P: ¿Qué es un nivel de confianza?
R: Un nivel de confianza es la probabilidad de que el parámetro que se está estimando se encuentre dentro del intervalo de confianza, y a menudo se da en forma de porcentaje (por ejemplo, intervalo de confianza del 95%).
P: ¿Qué son los límites de confianza?
R: Los límites de confianza son los puntos finales de un intervalo de confianza, que definen el rango de valores aceptables para el parámetro que se está estimando.
P: ¿Cómo afecta el nivel de confianza al intervalo de confianza?
R: En un procedimiento de estimación determinado, cuanto mayor sea el nivel de confianza, más amplio será el intervalo de confianza.
P: ¿Qué supuestos son necesarios para calcular un intervalo de confianza?
R: El cálculo de un intervalo de confianza suele requerir supuestos sobre la naturaleza del proceso de estimación, como el supuesto de que la distribución de la población de la que procede la muestra es normal.
P: ¿Son los intervalos de confianza estadísticas robustas?
R: Los intervalos de confianza, como se explica a continuación, no son estadísticas robustas, aunque se pueden hacer ajustes para añadir robustez.
Buscar dentro de la enciclopedia