Watson — IBMův systém umělé inteligence pro zodpovídání otázek (Jeopardy! 2011)
Watson — IBMův průlomový systém umělé inteligence pro odpovídání na otázky; v Jeopardy! 2011 porazil šampiony. Poznejte principy, zdroje dat a průběh vítězství.
Watson je uměle inteligentní počítačový systém, který dokáže odpovídat na otázky položené v přirozeném jazyce. Byl vytvořen společností IBM v rámci výzkumného projektu DeepQA a poprvé byl veřejně známý díky účasti v americké televizní soutěži televizní hře Jeopardy!. V únoru 2011 se Watson zúčastnil soutěže Jeopardy! proti dřívějším šampionům Kenu Jenningsovi a Bradu Rutterovi a získal první místo s finanční cenou 1 milion dolarů. Byl pojmenován po Thomasi J. Watsonovi, který byl v letech 1914 až 1956 předsedou a výkonným ředitelem společnosti IBM.
Technologie a principy
Watson není jediný „klasický“ expertní systém; kombinoval několik moderních metod zpracování jazyka a strojového učení. Mezi klíčové komponenty patří:
- Analýza otázky: rozpoznání typu otázky, možných entit a sémantických vztahů v nápovědě.
- Generování hypotéz: vytvoření velkého množství kandidátních odpovědí na základě různých zdrojů a patternů.
- Vyhledávání důkazů: extrakce podpůrných informací z databází a textů (unstructured a semi-structured data).
- Hodnocení a škálování: použití stovek statistických modelů a strojového učení pro přiřazení skóre a odhad pravděpodobnosti správnosti každé hypotézy.
- Odhad důvěry: konečné určení míry jistoty (confidence) pro každou odpověď, podle níž se rozhoduje o „zabzučení“ (zahájení odpovědi).
Architektura Watsona byla paralelní a škálovatelná; systém běžel na clusteru výkonných serverů IBM (přes 2000 procesorových jader, konkrétně 2880 jader) a využíval desítky terabajtů operační paměti (přibližně 16 TB), aby mohl v reálném čase zpracovávat velké množství textu a hodnotit mnoho hypotéz současně.
Data a trénink
Během hry měl Watson přístup k 200 milionům stránek obsahu, včetně úplného textu Wikipedie. Zdrojem informací pro Watsona byly encyklopedie, slovníky, tezaury, zpravodajské články a knihy. Data byla předzpracována, indexována a anotována tak, aby je systémy Watsonu dokázaly rychle vyhledávat a porovnávat. Systém se učil vážit různé typy důkazů na základě předchozího tréninku a validace na historických datech.
Soutěž Jeopardy! (únor 2011)
Watson se v soutěži postavil proti lidským soupeřům Kenu Jenningsovi a Bradu Rutterovi; zápasy proběhly v polovině února 2011 a byly odvysílány během několika dní. V kontrastu s lidmi nebyl Watson v době soutěže připojen k internetu — používal pouze informace nahrané do jeho systému před zápasem. U každé nápovědy se na televizní obrazovce zobrazily tři nejpravděpodobnější odpovědi Watsona a míra jeho důvěry v tyto odpovědi. Pokud byla jeho důvěra v odpověď dostatečně vysoká, systém „stiskl“ elektronický buzzer a poskytl odpověď v požadovaném formátu (v Jeopardy! obvykle ve formě otázky).
Průběh a význam výsledku
Watsonova výhra měla silný mediální a odborný dopad. Ukázala, že systémy založené na statistické analýze přirozeného jazyka a strojovém učení mohou v konkurenčních podmínkách dosahovat výkonu srovnatelného s vrcholovými lidskými odborníky v úzké doméně. Zároveň ale výsledky upozornily na rozdíl mezi rychlým zpracováním textu a skutečným porozuměním světu — Watson fungoval jako vysoce sofistikovaný pattern‑matcher a hodnotič důkazů, nikoli jako obecně inteligentní entita disponující „běžným zdravým rozumem“.
Aplikace a následky
Po úspěchu v Jeopardy! IBM transformovala technologii Watson do komerčních produktů a řešení v oblastech jako zdravotnictví (podpora diagnostiky a analýzy lékařských textů), zákaznický servis, finanční analýzy a správa znalostí. Značka „Watson“ se stala zastřešujícím názvem pro sadu analytických a AI nástrojů. Komerční nasazení mělo smíšené výsledky — v některých oblastech byla technologie přínosná, jinde se projevily omezení v robustnosti, přenositelnosti modelů a nutnosti kvalitních tréninkových dat.
Omezení a kritika
- Watson někdy dával chybnou nebo absurdní odpověď u nápověd vyžadujících komplexní kontext nebo „zdravý rozum“.
- Systém byl citlivý na kvalitu a pokrytí tréninkových zdrojů — pokud v datech chyběly určité druhy informací, Watson je nedokázal doplnit.
- Komerční využití vyžadovalo značné úsilí na přizpůsobení modelů konkrétním doménám a integraci s existujícími pracovními postupy.
Navzdory omezením Watson významně posunul hranice praktického využití zpracování přirozeného jazyka a obnovil zájem veřejnosti i průmyslu o možné aplikace umělé inteligence v reálném světě.

Zaměstnanci IBM testují systém Watson.
Otázky a odpovědi
Otázka: Co je to Watson?
Odpověď: Watson je uměle inteligentní počítačový systém, který dokáže odpovídat na otázky položené v přirozeném jazyce.
Otázka: Kdo vytvořil systém Watson?
Odpověď: Watson vyrobila společnost IBM.
Otázka: Jaký byl účel Watsona v soutěži Jeopardy!?
Odpověď: Účelem Watsona v soutěži Jeopardy! bylo soupeřit s minulými šampiony Kenem Jenningsem a Bradem Rutterem.
Otázka: Vyhrál Watson v soutěži Jeopardy!?
Odpověď: Ano, Watson vyhrál v soutěži Jeopardy! první místo ve výši 1 milionu dolarů.
Otázka: Po kom byl Watson pojmenován?
Odpověď: Watson byl pojmenován po Thomasi J. Watsonovi, který byl v letech 1914 až 1956 předsedou a generálním ředitelem společnosti IBM.
Otázka: Jaké zdroje informací používal Watson k zodpovězení otázek?
Odpověď: Zdrojem informací pro Watsona byly encyklopedie, slovníky, tezaury, zpravodajské články a knihy.
Otázka: Byl Watson během soutěže Jeopardy! připojen k internetu?
Odpověď: Ne, Watson nebyl během soutěže Jeopardy! připojen k internetu, což znamená, že k zodpovězení nápověd musel použít to, co měl ve svém systému.
Vyhledávání