Resumen y definición
El teorema de Bayes describe cómo actualizar la probabilidad de una hipótesis a la luz de nueva información. Establece una relación entre la probabilidad condicional de un suceso dado otro y su inversa, permitiendo calcular la probabilidad de una hipótesis H dado un dato D a partir de la probabilidad de observar D si H fuera cierta.
Fórmula y componentes
En forma simbólica se expresa como: P(H|D) = P(D|H) · P(H) / P(D). Sus componentes principales son:
- Prior (P(H)): probabilidad inicial asignada a la hipótesis antes de ver el dato.
- Verosimilitud (P(D|H)): probabilidad de observar el dato si la hipótesis es verdadera.
- Evidencia o probabilidad marginal (P(D)): probabilidad total de observar el dato bajo todas las hipótesis posibles.
- Posterior (P(H|D)): probabilidad actualizada de la hipótesis tras incorporar el dato.
Derivación elemental
La fórmula se obtiene de la definición básica de probabilidad condicional: P(H|D) = P(H y D)/P(D) y, por otra parte, P(H y D) = P(D|H)·P(H). Sustituyendo y dividiendo por P(D) aparece la expresión de Bayes. Para calcular P(D) a menudo se emplea la ley de la probabilidad total, sumando las contribuciones de todas las hipótesis relevantes.
Breve historia
Recibe su nombre de Thomas Bayes, quien en el siglo XVIII trabajó en fundamentos de probabilidad. Sus ideas fueron desarrolladas posteriormente por matemáticos como Pierre-Simon Laplace, que extendieron y aplicaron el enfoque. Hoy se le conoce también como ley o regla de Bayes.
Usos y ejemplos prácticos
El teorema de Bayes es fundamental en numerosas áreas. En medicina ayuda a interpretar pruebas diagnósticas: la probabilidad de enfermedad tras un resultado positivo depende tanto de la precisión del test como de la prevalencia previa. En filtrado de correo, modelos bayesianos combinan evidencias de palabras para estimar si un mensaje es spam. En aprendizaje automático y estadística bayesiana se emplea para estimar parámetros y actualizar creencias; técnicas numéricas como muestreo por cadenas de Markov suelen usarse cuando los cálculos analíticos son complejos.
Distinciones y observaciones
Una distinción relevante es la entre enfoques bayesiano y frecuentista: el primero trata probabilidades como grados de creencia y usa priors, mientras que el segundo se centra en propiedades de procedimientos repetidos. La elección del prior puede influir en el resultado, por lo que existen criterios y prácticas para seleccionar priors informativos o no informativos según el contexto.
Para ampliar conceptos relacionados con la teoría de la probabilidad consulte probabilidad y para entender mejor el papel de las hipótesis en inferencia visite hipótesis.