Hollandova věta o schématu

Autor: Leandro Alegsa

05-04-2022 15:54

Hollandova věta o schématu, nazývaná také základní věta genetických algoritmů, je nerovnost, která vyplývá z hrubého zrnění rovnice pro evoluční dynamiku. Věta o schématu říká, že krátká schémata nízkého řádu s nadprůměrnou zdatností se v následujících generacích exponenciálně zvyšují. Větu navrhl John Holland v 70. letech 20. století. Zpočátku byl široce považován za základ pro vysvětlení síly genetických algoritmů. Tato interpretace jejích důsledků však byla kritizována v několika publikacích recenzovaných v , kde se ukazuje, že Věta o schématu je speciálním případem Priceovy rovnice s indikační funkcí schématu jako makroskopickým měřením.

Schéma je šablona, která identifikuje podmnožinu řetězců s podobnostmi na určitých pozicích řetězců. Schémata jsou speciálním případem válcových množin, a proto tvoří topologický prostor.

Popis

Uvažujme binární řetězce délky 6. Schéma 1*10*1 popisuje množinu všech řetězců délky 6 s jedničkami na pozicích 1, 3 a 6 a nulou na pozici 4. Znak * je zástupný symbol, což znamená, že pozice 2 a 5 mohou mít hodnotu 1 nebo 0. Pořadí schématu o ( H ) {\displaystyle o(H)} $o(H)$ je definováno jako počet pevných pozic v šabloně, zatímco definiční délka δ ( H ) {\displaystyle \delta (H)} $\delta (H)$ je vzdálenost mezi první a poslední konkrétní pozicí. Řád 1*10*1 je 4 a jeho definiční délka je 5. Fitness schématu je průměrná fitness všech řetězců odpovídajících schématu. Fitness řetězce je mírou hodnoty zakódovaného řešení problému vypočtené vyhodnocovací funkcí specifickou pro daný problém. S využitím zavedených metod a genetických operátorů genetických algoritmů věta o schématu říká, že krátká schémata nízkého řádu s nadprůměrnou fitness v následujících generacích exponenciálně rostou. Vyjádřeno rovnicí:

E ( m ( H , t + 1 ) ) ≥ m ( H , t ) f ( H ) a t [ 1 - p ] . {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1 - p]. } $\operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p].$

Zde m ( H , t ) {\displaystyle m(H,t)} $m(H,t)$ je počet řetězců patřících do schématu H {\displaystyle H} $H$ v generaci t {\displaystyle t}. $t$ , f ( H ) {\displaystyle f(H)} $f(H)$ je pozorovaná průměrná fitness schématu H {\displaystyle H} $H$ a a t {\displaystyle a_{t}} $a_{t}$ je pozorovaná průměrná fitness v generaci t {\displaystyle t} $t$ . Pravděpodobnost narušení p {\displaystyle p} $p$ je pravděpodobnost, že křížení nebo mutace zničí schéma H {\displaystyle H} $H$ . Lze ji vyjádřit jako:

p = δ ( H ) l - 1 p c + o ( H ) p m {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}} $p={\delta (H) \over l-1}p_{c}+o(H)p_{m}$

kde o ( H ) {\displaystyle o(H)} $o(H)$ je pořadí schématu, l {\displaystyle l} $l$ je délka kódu, p m {\displaystyle p_{m}} $p_{m}$ je pravděpodobnost mutace a p c {\displaystyle p_{c}} $p_{c}$ je pravděpodobnost křížení. Schéma s kratší definiční délkou δ ( H ) {\displaystyle \delta (H)} $\delta (H)$ má tedy menší pravděpodobnost narušení.
Často nepochopeným bodem je, proč je věta o schématu nerovností, a nikoli rovností. Odpověď je ve skutečnosti jednoduchá: Věta zanedbává malou, ale nenulovou pravděpodobnost, že řetězec patřící do schématu H {\displaystyle H} $H$ vznikne "od nuly" mutací jednoho řetězce (nebo rekombinací dvou řetězců), který v předchozí generaci nepatřil do H {\displaystyle H} . $H$

Omezení

Věta o schématech platí za předpokladu genetického algoritmu, který udržuje nekonečně velkou populaci, ale ne vždy se přenáší do (konečné) praxe: v důsledku chyby výběru vzorků v počáteční populaci mohou genetické algoritmy konvergovat ke schématům, která nemají žádnou selekční výhodu. K tomu dochází zejména v multimodální optimalizaci, kde funkce může mít více vrcholů: populace může driftovat tak, že bude preferovat jeden z vrcholů a ignorovat ostatní.

Důvodem, proč věta o schématu nemůže vysvětlit sílu genetických algoritmů, je to, že platí pro všechny případy problémů a nedokáže rozlišit mezi problémy, ve kterých genetické algoritmy fungují špatně, a problémy, ve kterých genetické algoritmy fungují dobře.

Graf multimodální funkce ve dvou proměnných.

Otázky a odpovědi

Otázka: Co je Hollandův teorém schématu?

Odpověď: Hollandův teorém o schématu je teorém týkající se genetických algoritmů, který říká, že jedinci s vyšší než průměrnou zdatností mají větší pravděpodobnost převahy.

Otázka: Kdo a kdy navrhl Hollandovu větu o schématu?

Odpověď: John Holland navrhl Hollandovu větu o schématu v 70. letech 20. století.

Otázka: Co je to schéma v kontextu genetických algoritmů?

Odpověď: V kontextu genetických algoritmů je schéma šablona, která identifikuje podmnožinu řetězců s podobnostmi na určitých pozicích řetězců.

Otázka: Jaká je interpretace Hollandovy věty o schématu, která byla použita jako základ pro vysvětlení síly genetických algoritmů?

Odpověď: Interpretace Hollandova teorému o schématu, která byla použita jako základ pro vysvětlení síly genetických algoritmů, je, že jedinci s fitness, který je vyšší než průměr, mají větší pravděpodobnost převahy.

Otázka: Co ukázala kritika Hollandova teorému o schématu?

Odpověď: Kritika Hollandova teorému o schématu ukázala, že se jedná o speciální případ Priceovy rovnice s funkcí indikátoru schématu jako makroskopickou mírou.

Otázka: Co je speciálním případem válcových množin?

Odpověď: Schémata jsou zvláštním případem válcových množin.

Otázka: Jaký druh prostoru tvoří schémata?

Odpověď: Schémata tvoří topologický prostor.

Vyhledávání