Výběrový soubor

Ve statistice je vzorek součástí populace. Vzorek je pečlivě vybrán. Měl by spravedlivě reprezentovat celou populaci bez zkreslení. Vzorky jsou potřebné proto, že populace mohou být tak velké, že spočítání všech jedinců nemusí být možné nebo praktické.

Řešení problému ve statistice proto obvykle začíná výběrem vzorku. Výběr vzorků spočívá ve výběru dat, která budou později analyzována. Jako příklad uveďme, že pro účely studie je třeba analyzovat znečištění jezera. V závislosti na tom, kde byly vzorky vody odebrány, může mít studie různé výsledky. Obecně platí, že vzorky musí být náhodné. To znamená, že šance nebo pravděpodobnost výběru jednoho jedince je stejná jako šance výběru jakéhokoli jiného jedince.

V praxi se náhodné vzorky vždy odebírají přesně definovaným postupem. Postup je soubor pravidel, posloupnost kroků zapsaných na papíře a přesně dodržovaných. I tak může ve vzorku zůstat určitá odchylka. Vezměme si problém sestavení vzorku pro předpověď výsledku volebního průzkumu. Všechny známé metody mají své problémy a výsledky voleb se často liší od předpovědí založených na vzorku. Pokud zjišťujete názory pomocí telefonů nebo setkáváním s lidmi na ulici, vzorek vždy obsahuje zkreslení. Proto v případech, jako je tento, není nikdy možné získat zcela neutrální vzorek. V takových případech se statistik zamyslí nad tím, jak změřit míru zkreslení, a existují způsoby, jak ji odhadnout.

Podobná situace nastává, když vědci měří fyzikální vlastnosti, například hmotnost kusu kovu nebo rychlost světla. Pokud předmět zvážíme citlivým zařízením, dostaneme nepatrně odlišné výsledky. Žádný systém měření není nikdy dokonalý. Získáme řadu odhadů, přičemž každý z nich je měřením. Jedná se o vzorky s určitou mírou chyby. Statistika je určena k popisu chyb a k provádění analýzy tohoto druhu dat.

Existují různé druhy vzorků:

Hraniční policie hledá nelegální drogy pomocí speciálně vycvičeného psa: Pokud kontrolují každé desáté auto, odebírají objektivní vzorek.Zoom
Hraniční policie hledá nelegální drogy pomocí speciálně vycvičeného psa: Pokud kontrolují každé desáté auto, odebírají objektivní vzorek.

Stratifikovaný výběr vzorků

Pokud má populace zjevné subpopulace, je třeba odebrat vzorky z každé z nich. Tomuto postupu se říká stratifikovaný výběr. Stratifikovaný výběr se také nazývá stratifikovaný náhodný výběr. Stratifikovaný výběr se často znázorňuje jako podíl, například v procentech (%).

Předpokládejme, že se v rámci experimentu zjišťují příjmy dospělých osob. Je zřejmé, že příjmy absolventů vysokých škol se mohou lišit od příjmů osob, které vysokou školu nevystudovaly. Nyní předpokládejme, že počet absolventů mužského pohlaví činil 30 % z celkového počtu dospělých mužů (imaginární čísla). Pak byste zařídili, aby 30 % z celkového vzorku tvořili náhodně vybraní absolventi mužského pohlaví a 70 % z celkového vzorku tvořili muži, kteří nemají vysokoškolské vzdělání. Postup opakujte pro ženy, protože procento absolventek se liší od procenta mužů. Tím získáme vzorek dospělé populace rozvrstvený podle pohlaví a vysokoškolského vzdělání. Dalším krokem by bylo rozdělit každou z vašich dílčích populací podle věkových skupin, protože (například) absolventi mohou ve středním věku získat větší příjem ve srovnání s neabsolventy.

Další typ stratifikovaného vzorku se zabývá variabilitou. V tomto případě se z variabilnějších dílčích populací vybírají větší vzorky, aby souhrnné statistiky, jako jsou střední hodnoty a směrodatné odchylky, byly spolehlivější.

Otázky a odpovědi

Otázka: Co je to vzorek ve statistice?


Odpověď: Ve statistice je vzorek část populace, která byla pečlivě vybrána tak, aby spravedlivě a bez zkreslení reprezentovala celou populaci.

Otázka: K čemu jsou potřebné vzorky?


Odpověď: Vzorky jsou potřebné, protože populace mohou být tak velké, že spočítání všech jedinců nemusí být možné nebo praktické. Proto řešení problému ve statistice obvykle začíná výběrem vzorků.

Otázka: Jak se reprezentuje vzorek?


Odpověď: Pokud se s výběrem zachází jako se souborem dat, je často reprezentován velkými písmeny, jako jsou X a Y, přičemž jeho prvky jsou reprezentovány malými písmeny (např. x3) a velikost vzorku je reprezentována písmenem n.

Otázka: Jaké by měly být vzorky?


Odpověď: Obecně platí, že vzorky musí být náhodné, což znamená, že šance nebo pravděpodobnost výběru jednoho jedince je stejná jako šance výběru jakéhokoli jiného jedince. V praxi se náhodné vzorky vždy vybírají pomocí přesně definovaného postupu.

Otázka: Může ve vzorcích zůstat zkreslení?


Odpověď: I při použití dobře definovaných postupů pro výběr vzorků může ve vzorku zůstat určitá odchylka způsobená faktory, jako je například to, kdo zvedá telefonní hovory nebo kdo chodí po určitých ulicích při zjišťování názorů pro předpověď volebního průzkumu. V takových případech může být obtížné získat zcela neutrální vzorky, ale statistici mohou změřit, jak moc je zkreslení přítomno.

Otázka: Existují různé druhy vzorků?


Odpověď: Ano, existují různé druhy vzorků, včetně úplných vzorků, které zahrnují všechny prvky, jež mají dané vlastnosti, a nestranných/reprezentativních vzorků, které zahrnují výběr prvků z úplných vzorků bez závislosti na jejich vlastnostech. Způsob získání vzorku spolu s jeho velikostí ovlivní způsob, jakým se na údaje pohlíží.

AlegsaOnline.com - 2020 / 2023 - License CC3