Hollandova věta o schématu

Hollandova věta o schématu, nazývaná také základní věta genetických algoritmů, je nerovnost, která vyplývá z hrubého zrnění rovnice pro evoluční dynamiku. Věta o schématu říká, že krátká schémata nízkého řádu s nadprůměrnou zdatností se v následujících generacích exponenciálně zvyšují. Větu navrhl John Holland v 70. letech 20. století. Zpočátku byl široce považován za základ pro vysvětlení síly genetických algoritmů. Tato interpretace jejích důsledků však byla kritizována v několika publikacích recenzovaných v , kde se ukazuje, že Věta o schématu je speciálním případem Priceovy rovnice s indikační funkcí schématu jako makroskopickým měřením.

Schéma je šablona, která identifikuje podmnožinu řetězců s podobnostmi na určitých pozicích řetězců. Schémata jsou speciálním případem válcových množin, a proto tvoří topologický prostor.

Popis

Uvažujme binární řetězce délky 6. Schéma 1*10*1 popisuje množinu všech řetězců délky 6 s jedničkami na pozicích 1, 3 a 6 a nulou na pozici 4. Znak * je zástupný symbol, což znamená, že pozice 2 a 5 mohou mít hodnotu 1 nebo 0. Pořadí schématu o ( H ) {\displaystyle o(H)}{\displaystyle o(H)} je definováno jako počet pevných pozic v šabloně, zatímco definiční délka δ ( H ) {\displaystyle \delta (H)}{\displaystyle \delta (H)} je vzdálenost mezi první a poslední konkrétní pozicí. Řád 1*10*1 je 4 a jeho definiční délka je 5. Fitness schématu je průměrná fitness všech řetězců odpovídajících schématu. Fitness řetězce je mírou hodnoty zakódovaného řešení problému vypočtené vyhodnocovací funkcí specifickou pro daný problém. S využitím zavedených metod a genetických operátorů genetických algoritmů věta o schématu říká, že krátká schémata nízkého řádu s nadprůměrnou fitness v následujících generacích exponenciálně rostou. Vyjádřeno rovnicí:

E ( m ( H , t + 1 ) ) ≥ m ( H , t ) f ( H ) a t [ 1 - p ] . {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1 - p]. } {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p].}

Zde m ( H , t ) {\displaystyle m(H,t)}{\displaystyle m(H,t)} je počet řetězců patřících do schématu H {\displaystyle H}{\displaystyle H} v generaci t {\displaystyle t}. {\displaystyle t}, f ( H ) {\displaystyle f(H)}{\displaystyle f(H)} je pozorovaná průměrná fitness schématu H {\displaystyle H}{\displaystyle H} a a t {\displaystyle a_{t}}{\displaystyle a_{t}} je pozorovaná průměrná fitness v generaci t {\displaystyle t}{\displaystyle t} . Pravděpodobnost narušení p {\displaystyle p}{\displaystyle p} je pravděpodobnost, že křížení nebo mutace zničí schéma H {\displaystyle H}{\displaystyle H} . Lze ji vyjádřit jako:

p = δ ( H ) l - 1 p c + o ( H ) p m {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}} {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}}

kde o ( H ) {\displaystyle o(H)}{\displaystyle o(H)} je pořadí schématu, l {\displaystyle l}{\displaystyle l} je délka kódu, p m {\displaystyle p_{m}}{\displaystyle p_{m}} je pravděpodobnost mutace a p c {\displaystyle p_{c}}{\displaystyle p_{c}} je pravděpodobnost křížení. Schéma s kratší definiční délkou δ ( H ) {\displaystyle \delta (H)}{\displaystyle \delta (H)} má tedy menší pravděpodobnost narušení.
Často nepochopeným bodem je, proč je věta o schématu nerovností, a nikoli rovností. Odpověď je ve skutečnosti jednoduchá: Věta zanedbává malou, ale nenulovou pravděpodobnost, že řetězec patřící do schématu H {\displaystyle H}{\displaystyle H} vznikne "od nuly" mutací jednoho řetězce (nebo rekombinací dvou řetězců), který v předchozí generaci nepatřil do H {\displaystyle H} . {\displaystyle H}

Omezení

Věta o schématech platí za předpokladu genetického algoritmu, který udržuje nekonečně velkou populaci, ale ne vždy se přenáší do (konečné) praxe: v důsledku chyby výběru vzorků v počáteční populaci mohou genetické algoritmy konvergovat ke schématům, která nemají žádnou selekční výhodu. K tomu dochází zejména v multimodální optimalizaci, kde funkce může mít více vrcholů: populace může driftovat tak, že bude preferovat jeden z vrcholů a ignorovat ostatní.

Důvodem, proč věta o schématu nemůže vysvětlit sílu genetických algoritmů, je to, že platí pro všechny případy problémů a nedokáže rozlišit mezi problémy, ve kterých genetické algoritmy fungují špatně, a problémy, ve kterých genetické algoritmy fungují dobře.

Graf multimodální funkce ve dvou proměnných.Zoom
Graf multimodální funkce ve dvou proměnných.

Otázky a odpovědi

Otázka: Co je Hollandův teorém schématu?


Odpověď: Hollandův teorém o schématu je teorém týkající se genetických algoritmů, který říká, že jedinci s vyšší než průměrnou zdatností mají větší pravděpodobnost převahy.

Otázka: Kdo a kdy navrhl Hollandovu větu o schématu?


Odpověď: John Holland navrhl Hollandovu větu o schématu v 70. letech 20. století.

Otázka: Co je to schéma v kontextu genetických algoritmů?


Odpověď: V kontextu genetických algoritmů je schéma šablona, která identifikuje podmnožinu řetězců s podobnostmi na určitých pozicích řetězců.

Otázka: Jaká je interpretace Hollandovy věty o schématu, která byla použita jako základ pro vysvětlení síly genetických algoritmů?


Odpověď: Interpretace Hollandova teorému o schématu, která byla použita jako základ pro vysvětlení síly genetických algoritmů, je, že jedinci s fitness, který je vyšší než průměr, mají větší pravděpodobnost převahy.

Otázka: Co ukázala kritika Hollandova teorému o schématu?


Odpověď: Kritika Hollandova teorému o schématu ukázala, že se jedná o speciální případ Priceovy rovnice s funkcí indikátoru schématu jako makroskopickou mírou.

Otázka: Co je speciálním případem válcových množin?


Odpověď: Schémata jsou zvláštním případem válcových množin.

Otázka: Jaký druh prostoru tvoří schémata?


Odpověď: Schémata tvoří topologický prostor.

AlegsaOnline.com - 2020 / 2023 - License CC3