Simpsonův paradox
Simpsonův paradox je paradox ze statistiky. Je pojmenován po Edwardu H. Simpsonovi, britském statistikovi, který jej poprvé popsal v roce 1951. Statistik Karl Pearson popsal velmi podobný efekt v roce 1899.- Popis Udnyho Yuleho pochází z roku 1903. Někdy se nazývá Yule-Simpsonův efekt. Při pohledu na statistické výsledky skupin se tyto výsledky mohou měnit v závislosti na tom, zda se na skupiny pohlíží po jedné, nebo zda se spojí do větší skupiny. Tento případ se často vyskytuje ve společenských vědách a lékařské statistice. Může lidi zmást, pokud se k vysvětlení příčinného vztahu používají údaje o četnostech. Mezi další názvy tohoto paradoxu patří paradox zvratu a paradox slučování.
Příklad: Léčba ledvinových kamenů
Toto je skutečný příklad z lékařské studie, která srovnávala úspěšnost dvou způsobů léčby ledvinových kamenů.
V tabulce jsou uvedeny míry úspěšnosti a počty zákroků pro léčbu malých i velkých ledvinových kamenů, přičemž léčba A zahrnuje všechny otevřené zákroky a léčba B perkutánní nefrolitotomii:
Ošetření A | Ošetření B | |||
úspěch | selhání | úspěch | selhání | |
Malé kameny | Skupina 1 | Skupina 2 | ||
počet pacientů | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Velké kameny | Skupina 3 | Skupina 4 | ||
počet pacientů | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Obě stránky | Skupina 1+3 | Skupina 2+4 | ||
počet pacientů | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Paradoxním závěrem je, že léčba A je účinnější při použití na malé kameny a také při použití na velké kameny, avšak léčba B je účinnější při zohlednění obou velikostí současně. V tomto příkladu nebylo známo, že by velikost ledvinového kamene ovlivňovala výsledek. Tomu se ve statistice říká skrytá proměnná (nebo číhající proměnná).
O tom, která léčba je považována za lepší, rozhoduje nerovnost mezi dvěma poměry (úspěchy/celkem). K obrácení nerovnosti mezi poměry, které vytváří Simpsonův paradox, dochází proto, že se dva efekty vyskytují společně:
- Velikosti skupin, které se spojí, když se ignoruje číhající proměnná, jsou velmi rozdílné. Lékaři mají tendenci poskytovat těžkým případům (velké kameny) lepší léčbu (A) a mírnějším případům (malé kameny) horší léčbu (B). Proto v součtech dominují skupiny tři a dva, a nikoliv dvě mnohem menší skupiny jedna a čtyři.
- Velký vliv na poměry má číhající proměnná, tj. úspěšnost je silněji ovlivněna závažností případu než volbou léčby. Proto si skupina pacientů s velkými kameny používající léčbu A (skupina tři) vede hůře než skupina s malými kameny, i když ta použila horší léčbu B (skupina dva).