Průměr, medián nebo modus?
Všechny tři jsou míry středu, ale říkají různé věci:
- Průměr (mean) — součet dělený počtem. Citlivý na extrémy: průměrná mzda v ČR je ~45 000 Kč, ale mediánová mzda je ~38 000 Kč — průměr táhnou nahoru extrémně vysoké platy.
- Medián — středová hodnota seřazené řady. Polovina hodnot je nad ním, polovina pod. Odolný vůči extrémům.
- Modus — nejčastěji se vyskytující hodnota. Použitelný pro kategorická data (nejoblíbenější barva).
Směrodatná odchylka — co nám říká
Směrodatná odchylka (σ nebo s) měří, jak moc jsou hodnoty rozptýleny kolem průměru. Nízká hodnota = data blízko průměru. Vysoká = data jsou roztažená.
Příklad: teploty v Praze vs. v Reykjavíku. Praha má průměr 8 °C, ale velkou odchylku (−20 °C v zimě, +35 °C v létě). Reykjavík má průměr 5 °C, ale malou odchylku — klima je rovnoměrnější díky oceánu.
Populační odchylka (σ) se používá pro celou populaci. Výběrová (s) pro vzorek — dělí se (n−1) pro korekci Besselovy chyby.
Normální rozdělení a pravidlo 68-95-99,7
Mnoho přírodních jevů má normální (Gaussovo) rozdělení — symetrické zvonovité rozložení. Pravidlo říká:
- ±1σ od průměru: ~68 % hodnot
- ±2σ od průměru: ~95 % hodnot
- ±3σ od průměru: ~99,7 % hodnot
Ve výrobě se používá „6 sigma" (Six Sigma) — systém kvality, kde chybovost nepřekračuje 3,4 milionin.