Normální rozdělení (Gaussovo): definice, vlastnosti a příklady

Normální (Gaussovo) rozdělení — přehled definice, vlastností, zvonové křivky, střední hodnoty a směrodatné odchylky s praktickými příklady a vysvětlením CLT.

Normální rozdělení je rozdělení pravděpodobnosti. Říká se mu také Gaussovo rozdělení, protože ho objevil Carl Friedrich Gauss. Normální rozdělení je spojité rozdělení pravděpodobnosti. Je velmi důležité v mnoha vědních oborech. Normální rozdělení je rodina rozdělení stejného obecného tvaru. Tato rozdělení se liší svými parametry polohy a měřítka: střední hodnota ("průměr") rozdělení určuje jeho polohu a směrodatná odchylka ("variabilita") určuje měřítko.

Standardní normální rozdělení (známé také jako rozdělení Z) je normální rozdělení se střední hodnotou nula a rozptylem jedna (zelené křivky na grafech vpravo). Často se mu říká zvonová křivka, protože graf jeho hustoty pravděpodobnosti vypadá jako zvon.

Mnoho hodnot se řídí normálním rozdělením. Důvodem je centrální limitní věta, která říká, že pokud je událost součtem jiných náhodných událostí, bude mít normální rozdělení. Mezi příklady patří např:

výšky lidí ve velké populaci,
chyby měření u přesných přístrojů,
IQ skóre v populaci (přibližně),
mnohé agregované ukazatele v ekonomii nebo biologii.

Matematická definice a hustota

Nechť X je náhodná veličina s parametry μ (střední hodnota) a σ > 0 (směrodatná odchylka). Její hustota pravděpodobnosti (pdf) je dána vzorcem

f(x) = 1 / (σ √(2π)) · exp(−(x − μ)² / (2 σ²))

Tento tvar určuje charakteristickou \"zvonovou\" křivku, která je symetrická kolem hodnoty μ a jejíž šířku určuje σ. Pro standardní normální rozdělení (μ = 0, σ = 1) se hustota zjednoduší na

φ(x) = 1 / √(2π) · exp(−x² / 2)

Základní vlastnosti

Symetrie: rozdělení je symetrické kolem μ; střední hodnota, medián a modus jsou stejné (rovny μ).
Rozptyl: Var(X) = σ².
Unimodalita: hustota má jediný vrchol v x = μ.
Transformace: pokud X ~ N(μ, σ²), pak aX + b ~ N(aμ + b, a²σ²) pro konstanty a, b (a ≠ 0).
Součet nezávislých normálních veličin: pokud X₁ ~ N(μ₁, σ₁²) a X₂ ~ N(μ₂, σ₂²) nezávislé, pak X₁ + X₂ ~ N(μ₁ + μ₂, σ₁² + σ₂²).
Momentové funkce: momentová generační funkce M(t) = exp(μ t + ½ σ² t²), charakteristická funkce φ(t) = exp(i μ t − ½ σ² t²).
Entropie: diferenciální entropie normálního rozdělení je ½ ln(2π e σ²).

Standardizace a výpočet pravděpodobností

Abychom počítali pravděpodobnost pro libovolné normální rozdělení, často použijeme standardizaci. Pro X ~ N(μ, σ²) definujeme

z = (X − μ) / σ.

Pak Z ~ N(0,1) a případy typu P(a < X < b) přepíšeme jako P((a − μ)/σ < Z < (b − μ)/σ). Pro Z používáme distribuční funkci Φ(z) = P(Z ≤ z) (hodnoty Φ se získávají z tabulek nebo numericky pomocí kalkulačky/softwaru).

Příklady:

IQ přibližně N(100, 15²). Pravděpodobnost, že náhodně vybraný jedinec má IQ mezi 85 a 115: z = (85−100)/15 = −1 a z = (115−100)/15 = 1, takže P(−1 < Z < 1) ≈ Φ(1) − Φ(−1) ≈ 0.8413 − 0.1587 = 0.6826 (tedy asi 68 %).
Pokud výška mužů má přibližně N(180 cm, 7² cm²), jaká je pravděpodobnost, že náhodně vybraný muž je vyšší než 190 cm? z = (190−180)/7 ≈ 1.4286, P(X > 190) = 1 − Φ(1.4286) ≈ 1 − 0.9236 ≈ 0.0764 (asi 7.6 %).

Pravidlo 68–95–99.7

Pro normální rozdělení platí přibližně:

asi 68 % hodnot leží v intervalu μ ± 1σ,
asi 95 % hodnot leží v intervalu μ ± 2σ,
asi 99.7 % hodnot leží v intervalu μ ± 3σ.

Souvislost s centrální limitní větou a praktické použití

Centrální limitní věta vysvětluje, proč je normální rozdělení tak často pozorované: součet nebo průměr velkého počtu nezávislých náhodných příspěvků (i když každý příspěvek sám nemusí být normální) se blíží normálnímu rozdělení. To dává normálnímu rozdělení klíčovou roli ve statistickém odhadu, testování hypotéz a inferenci.

Praktická uplatnění zahrnují odhad chyby měření, konstrukci intervalů spolehlivosti, modelování reziduí v regresi a mnoho dalších oblastí. Při aplikaci je však důležité ověřit předpoklad normality, např. pomocí histogramu, Q–Q grafu nebo testů jako Shapiro–Wilk nebo Kolmogorov–Smirnov; data nemusí být vždy normální (mohou být šikmá, mít těžší ocasy apod.).

Statistická inference a odhad parametrů

Pokud máme nezávislé pozorování X₁,...,X_n ze N(μ, σ²), běžné odhady jsou:

MLE pro μ je průměr: μ̂ = (1/n) Σ X_i;
MLE pro σ² je (1/n) Σ (X_i − μ̂)² (v praxi při odhadu rozptylu často používáme opravený odhad s dělením n−1 pro neutrálnost při malých n).

Omezení a varování

Ne každá reálná data jsou přesně normální – některá mohou být šikmá nebo mít těžší ocasy. V takových případech může být vhodné použít jiné modely (např. t‑rozdělení, lognormální, směsi normálních rozdělení) nebo transformace dat.
Při práci s extrémy (outliery) je potřeba opatrnosti: normální rozdělení má relativně tenké ocasy oproti některým jiným modelům.

Normální rozdělení je jednoduché, dobře pochopené a matematicky pohodlné — proto patří mezi nejčastější modely v teorii i praxi. Je však vždy nutné ověřit vhodnost jeho použití pro konkrétní data a úlohu.

Normální rozdělení (Gaussovo): definice, vlastnosti a příklady

Matematická definice a hustota

Základní vlastnosti

Standardizace a výpočet pravděpodobností

Pravidlo 68–95–99.7

Souvislost s centrální limitní větou a praktické použití

Statistická inference a odhad parametrů

Omezení a varování

Otázky a odpovědi

Otázka: Co je to normální rozdělení?

Otázka: Kdo objevil normální rozdělení?

Otázka: Co představují parametry umístění a měřítka v normálním rozdělení?

Otázka: Jak jsou reprezentovány parametry polohy a měřítka normálních rozdělení?

Otázka: Co je to standardní normální rozdělení?

Otázka: Proč se standardnímu normálnímu rozdělení často říká zvonová křivka?

Otázka: Proč se mnoho hodnot řídí normálním rozdělením?