Paradoja de Simpson
La paradoja de Simpson es una paradoja de la estadística. Lleva el nombre de Edward H. Simpson, un estadístico británico que la describió por primera vez en 1951. El estadístico Karl Pearson describió un efecto muy similar en 1899, y la descripción de Udny Yule data de 1903. A veces, se denomina efecto Yule-Simpson. Cuando se observan las puntuaciones estadísticas de los grupos, éstas pueden cambiar, dependiendo de si los grupos se observan uno a uno, o si se combinan en un grupo mayor. Este caso se da a menudo en las ciencias sociales y en las estadísticas médicas. Puede confundir a la gente, si los datos de frecuencia se utilizan para explicar una relación causal. Otros nombres de la paradoja son paradoja de la inversión y paradoja de la amalgama.
Ejemplo: Tratamiento de cálculos renales
Este es un ejemplo real de un estudio médico que compara las tasas de éxito de dos tratamientos para los cálculos renales.
La tabla muestra las tasas de éxito y el número de tratamientos para los cálculos renales pequeños y grandes, donde el tratamiento A incluye todos los procedimientos abiertos y el tratamiento B es la nefrolitotomía percutánea:
Tratamiento A | Tratamiento B | |||
éxito | fallo | éxito | fallo | |
Piedras pequeñas | Grupo 1 | Grupo 2 | ||
número de pacientes | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Piedras grandes | Grupo 3 | Grupo 4 | ||
número de pacientes | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Ambos | Grupo 1+3 | Grupo 2+4 | ||
número de pacientes | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
La conclusión paradójica es que el tratamiento A es más eficaz cuando se utiliza en cálculos pequeños, y también cuando se utiliza en cálculos grandes, pero el tratamiento B es más eficaz cuando se consideran ambos tamaños al mismo tiempo. En este ejemplo, no se sabía que el tamaño del cálculo renal influía en el resultado. Esto se denomina variable oculta (o variable al acecho) en estadística.
El tratamiento que se considera mejor viene determinado por una desigualdad entre dos ratios (éxitos/total). La inversión de la desigualdad entre los ratios, que crea la paradoja de Simpson, se produce porque se dan dos efectos a la vez:
- Los tamaños de los grupos, que se combinan cuando no se tiene en cuenta la variable de acecho, son muy diferentes. Los médicos tienden a dar a los casos graves (cálculos grandes) el mejor tratamiento (A), y a los casos más leves (cálculos pequeños) el tratamiento inferior (B). Por lo tanto, los totales están dominados por los grupos tres y dos, y no por los dos grupos uno y cuatro, mucho más pequeños.
- La variable de acecho tiene un gran efecto en los ratios, es decir, el porcentaje de éxito está más fuertemente influenciado por la gravedad del caso que por la elección del tratamiento. Por lo tanto, el grupo de pacientes con cálculos grandes que utilizan el tratamiento A (grupo tres) obtiene peores resultados que el grupo con cálculos pequeños, aunque este último haya utilizado el tratamiento inferior B (grupo dos).