Zipfův zákon

Zipfův zákon je empirický zákon formulovaný pomocí matematické statistiky, pojmenovaný po lingvistovi Georgi Kingsleym Zipfovi, který jej poprvé navrhl.

Zipfův zákon říká, že při velkém vzorku použitých slov je četnost jakéhokoli slova nepřímo úměrná jeho pořadí v tabulce četností. Slovo číslo n má tedy frekvenci úměrnou 1/n.

Nejfrekventovanější slovo se tedy bude vyskytovat přibližně dvakrát častěji než druhé nejfrekventovanější slovo, třikrát častěji než třetí nejfrekventovanější slovo atd. Například v jednom vzorku slov v anglickém jazyce tvoří nejčastěji se vyskytující slovo "the" téměř 7 % všech slov (69 971 z něco málo přes 1 milion). V souladu se Zipfovým zákonem je na druhém místě slovo "of", které tvoří něco přes 3,5 % slov (36 411 výskytů), následované slovem "and" (28 852). K tomu, aby se ve velkém vzorku vyskytla polovina slov, je zapotřebí jen asi 135 slov.

Stejný vztah se objevuje i v mnoha dalších žebříčcích, které nesouvisejí s jazykem, jako jsou žebříčky počtu obyvatel měst v různých zemích, velikosti společností, žebříčky příjmů atd. Výskytu rozdělení v žebříčcích měst podle počtu obyvatel si poprvé všiml Felix Auerbach v roce 1913.

Není známo, proč Zipfův zákon platí pro většinu jazyků.

Otázky a odpovědi

Otázka: Co je to Zipfův zákon?


Odpověď: Zipfův zákon je empirický zákon, který říká, že četnost slova ve velkém vzorku je nepřímo úměrná jeho pořadí v tabulce četností.

Otázka: Kdo navrhl Zipfův zákon?


Odpověď: Zipfův zákon poprvé navrhl lingvista George Kingsley Zipf.

Otázka: Jak Zipfův zákon vysvětluje frekvenci slov ve vzorku anglických slov?


Odpověď: Podle Zipfova zákona se nejfrekventovanější slovo ve vzorku anglických slov vyskytuje přibližně dvakrát častěji než druhé nejfrekventovanější slovo, třikrát častěji než třetí nejfrekventovanější slovo atd. Tento trend pokračuje s klesajícím pořadím slova.

Otázka: Jaké procento všech slov tvoří nejčastěji se vyskytující slovo v jednom vzorku anglických slov?


Odpověď: V jednom vzorku anglických slov tvoří nejčastěji se vyskytující slovo ("the") téměř 7 % všech slov.

Otázka: Jaký je vztah mezi počtem slov potřebných k vytvoření poloviny vzorku a četností těchto slov?


Odpověď: Podle Zipfova zákona je k vyjádření poloviny slov ve velkém vzorku zapotřebí pouze asi 135 slov.

Otázka: Jaké další žebříčky vykazují Zipfův zákon?


Odpověď: Stejný vztah, který Zipfův zákon popisuje u četnosti slov, se vyskytuje i v jiných žebříčcích, které nesouvisejí s jazykem, například v žebříčcích počtu obyvatel měst v různých zemích, velikostí společností a příjmů.

Otázka: Kdo si všiml výskytu rozdělení v žebříčcích měst podle počtu obyvatel?


Odpověď: Výskytu distribuce v žebříčcích měst podle počtu obyvatel si poprvé všiml Felix Auerbach v roce 1913.

AlegsaOnline.com - 2020 / 2023 - License CC3