Standardní chyba

Směrodatná chyba je směrodatná odchylka výběrového rozdělení statistiky. Tento termín lze použít také pro odhad (dobrý odhad) této směrodatné odchylky, který se provádí na základě vzorku celé skupiny.

Průměr určité části skupiny (tzv. vzorku) je obvyklý způsob, jak odhadnout průměr celé skupiny. Měření celé skupiny je často příliš obtížné nebo stojí příliš mnoho peněz. Pokud se však změří jiný vzorek, bude mít průměr, který se bude od prvního vzorku trochu lišit. Směrodatná chyba průměru je způsob, jak zjistit, jak blízko je průměr vzorku průměru celé skupiny. Je to způsob, jak zjistit, nakolik si můžete být jisti průměrem ze vzorku.

Při skutečných měřeních obvykle není známa skutečná hodnota směrodatné odchylky průměru pro celou skupinu. Proto se často používá termín směrodatná odchylka, který znamená odhad blízký skutečnému číslu pro celou skupinu. Čím více měření je ve vzorku, tím blíže bude odhad skutečnému číslu pro celou skupinu.

Pro hodnotu, která je vybrána s nezkreslenou normálně rozdělenou chybou, je výše znázorněn podíl vzorků, které by spadaly mezi 0, 1, 2 a 3 směrodatné odchylky nad a pod skutečnou hodnotu.Zoom
Pro hodnotu, která je vybrána s nezkreslenou normálně rozdělenou chybou, je výše znázorněn podíl vzorků, které by spadaly mezi 0, 1, 2 a 3 směrodatné odchylky nad a pod skutečnou hodnotu.

Jak zjistit standardní chybu průměru

Jedním ze způsobů, jak zjistit směrodatnou chybu průměru, je mít k dispozici velké množství vzorků. Nejprve se zjistí průměr pro každý vzorek. Poté se zjistí průměr a směrodatná odchylka těchto průměrů vzorků. Směrodatná odchylka všech průměrů vzorků je směrodatná chyba průměru. To může být velmi pracné. Někdy je příliš obtížné nebo stojí příliš mnoho peněz mít mnoho vzorků.

Dalším způsobem, jak zjistit směrodatnou chybu průměru, je použití rovnice, která potřebuje pouze jeden vzorek. Směrodatná chyba průměru se obvykle odhaduje pomocí směrodatné odchylky pro vzorek z celé skupiny (směrodatná odchylka vzorku) vydělené druhou odmocninou velikosti vzorku.

S E x¯ = s n {\displaystyle SE_{\bar {x}} ={\frac {s}{\sqrt {n}}}} {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

kde

s je výběrová směrodatná odchylka (tj. výběrový odhad směrodatné odchylky populace) a

n je počet měření ve vzorku.

Jak velký musí být vzorek, aby se odhad směrodatné chyby průměru blížil skutečné směrodatné chybě průměru pro celou skupinu? Ve vzorku by mělo být alespoň šest měření. Pak bude směrodatná chyba průměru pro vzorek v rozmezí 5 % směrodatné chyby průměru, pokud by byla měřena celá skupina.

Opravy některých případů

Existuje další rovnice, kterou lze použít, pokud se počet měření týká 5 % nebo více celé skupiny:

Pokud má vzorek méně než 20 měření, je třeba použít speciální rovnice.

Někdy pochází vzorek z jednoho místa, přestože celá skupina může být rozptýlena. Někdy také může být vzorek vytvořen v krátkém časovém období, i když celá skupina pokrývá delší časový úsek. V takovém případě nejsou počty ve vzorku nezávislé. Pak se používají speciální rovnice, které se to snaží korigovat.

Užitečnost

Praktický výsledek: Více měření ve vzorku zvyšuje jistotu průměrné hodnoty. Pak bude směrodatná chyba průměru menší, protože směrodatná odchylka se dělí větším číslem. Aby však byla nejistota (směrodatná chyba průměru) průměrné hodnoty poloviční, musí být velikost vzorku (n) čtyřikrát větší. Je to proto, že směrodatná odchylka se dělí druhou odmocninou velikosti vzorku. Aby byla nejistota o desetinu větší, musí být velikost vzorku (n) stokrát větší!

Standardní chyby se snadno počítají a často se používají, protože:

  • Pokud je známa směrodatná chyba několika jednotlivých veličin, lze v mnoha případech snadno vypočítat směrodatnou chybu určité funkce těchto veličin;
  • Pokud je známo rozdělení pravděpodobnosti hodnoty, lze z něj vypočítat dobrou aproximaci k přesnému intervalu spolehlivosti; a
  • Pokud rozdělení pravděpodobnosti není známo, lze k odhadu intervalu spolehlivosti použít jiné rovnice.
  • Jakmile je vzorek velmi velký, princip centrální limitní věty ukazuje, že čísla ve vzorku jsou velmi podobná číslům v celé skupině (mají normální rozdělení).

Relativní standardní chyba

Relativní standardní chyba (RSE) je standardní chyba dělená průměrem. Toto číslo je menší než jedna. Vynásobíme-li jej 100 %, dostaneme jej jako procento průměru. To pomáhá ukázat, zda je nejistota důležitá, nebo ne. Uvažujme například dva průzkumy příjmů domácností, které oba vedou k výběrovému průměru 50 000 USD. Pokud má jeden průzkum standardní chybu 10 000 USD a druhý 5 000 USD, pak relativní standardní chyby činí 20 %, resp. 10 %. Průzkum s nižší relativní směrodatnou chybou je lepší, protože má přesnější měření (nejistota je menší).

Lidé, kteří potřebují znát průměrné hodnoty, se často rozhodují, jak malá by měla být nejistota, než se rozhodnou informaci použít. Například americké Národní centrum pro zdravotní statistiku neuvádí průměr, pokud relativní standardní chyba přesahuje 30 %. NCHS také vyžaduje, aby bylo pro vykázání odhadu uvedeno alespoň 30 pozorování. []

Příklad

Například ve vodách Mexického zálivu žije mnoho okounů. Abychom zjistili, kolik průměrně váží 42 cm dlouhý okoun, není možné změřit všechny okouny, kteří jsou dlouzí 42 cm. Místo toho je možné změřit některé z nich. Ryby, které jsou skutečně změřeny, se nazývají vzorek. V tabulce jsou uvedeny hmotnosti dvou vzorků okounů, kteří jsou všichni dlouzí 42 cm. Průměrná (střední) hmotnost prvního vzorku je 0,741 kg. Průměrná (střední) hmotnost druhého vzorku je 0,735 kg, což je o něco málo více než u prvního vzorku. Každý z těchto průměrů se trochu liší od průměru, který by vznikl změřením každého 42 cm dlouhého okouna (což stejně není možné).

Nejistotu průměru lze použít k určení, jak blízko je průměr vzorků průměru, který by vznikl měřením celé skupiny. Nejistota průměru se odhaduje jako směrodatná odchylka pro vzorek dělená druhou odmocninou z počtu vzorků minus jedna. Z tabulky vyplývá, že nejistoty průměrů obou vzorků jsou si velmi blízké. Také relativní nejistota je nejistota průměru dělená průměrem krát 100 %. Relativní nejistota v tomto příkladu je 2,38 % a 2,50 % pro oba vzorky.

Znalost nejistoty průměru umožňuje zjistit, jak blízko je výběrový průměr průměru, který by vznikl měřením celé skupiny. Průměr pro celou skupinu je mezi a) průměrem pro vzorek plus nejistota průměru a b) průměrem pro vzorek minus nejistota průměru. V tomto příkladu se očekává, že průměrná hmotnost všech 42 cm dlouhých okounů v Mexickém zálivu bude 0,723-0,759 kg na základě prvního vzorku a 0,717-0,753 na základě druhého vzorku.

Zoom


Příklad okouníka (známého také jako červený buben, Sciaenops ocellatus) použitého v příkladu.Zoom
Příklad okouníka (známého také jako červený buben, Sciaenops ocellatus) použitého v příkladu.

Otázky a odpovědi

Otázka: Co je to standardní chyba?


Odpověď: Směrodatná chyba je směrodatná odchylka výběrového rozdělení statistiky.

Otázka: Lze termín směrodatná chyba použít pro odhad směrodatné odchylky?


Odpověď: Ano, termín směrodatná odchylka lze použít pro odhad (dobrý odhad) této směrodatné odchylky, který byl proveden na základě vzorku celé skupiny.

Otázka: Jak se odhaduje průměr pro celou skupinu?


Odpověď: Obvyklým způsobem odhadu průměru pro celou skupinu je průměr z určité části skupiny (nazývané vzorek).

Otázka: Proč je obtížné měřit celou skupinu?


Odpověď: Měření celé skupiny je často příliš obtížné nebo nákladné.

Otázka: Co je to standardní chyba průměru a co určuje?


Odpověď: Směrodatná chyba průměru je způsob, jak zjistit, jak blízko je průměr vzorku průměru celé skupiny. Je to způsob, jak zjistit, nakolik si můžeme být jisti průměrem ze vzorku.

Otázka: Je skutečná hodnota směrodatné odchylky průměru při skutečných měřeních obvykle známa?


Odpověď: Ne, skutečná hodnota směrodatné odchylky průměru pro celou skupinu není při skutečných měřeních obvykle známa.

Otázka: Jak ovlivňuje počet měření ve vzorku přesnost odhadu?


Odpověď: Čím více měření je ve vzorku, tím blíže bude odhad skutečnému číslu pro celou skupinu.

AlegsaOnline.com - 2020 / 2023 - License CC3