Watson — IBMův systém umělé inteligence pro zodpovídání otázek (Jeopardy! 2011)

Watson — IBMův průlomový systém umělé inteligence pro odpovídání na otázky; v Jeopardy! 2011 porazil šampiony. Poznejte principy, zdroje dat a průběh vítězství.

Autor: Leandro Alegsa

Watson je uměle inteligentní počítačový systém, který dokáže odpovídat na otázky položené v přirozeném jazyce. Byl vytvořen společností IBM v rámci výzkumného projektu DeepQA a poprvé byl veřejně známý díky účasti v americké televizní soutěži televizní hře Jeopardy!. V únoru 2011 se Watson zúčastnil soutěže Jeopardy! proti dřívějším šampionům Kenu Jenningsovi a Bradu Rutterovi a získal první místo s finanční cenou 1 milion dolarů. Byl pojmenován po Thomasi J. Watsonovi, který byl v letech 1914 až 1956 předsedou a výkonným ředitelem společnosti IBM.

Technologie a principy

Watson není jediný „klasický“ expertní systém; kombinoval několik moderních metod zpracování jazyka a strojového učení. Mezi klíčové komponenty patří:

  • Analýza otázky: rozpoznání typu otázky, možných entit a sémantických vztahů v nápovědě.
  • Generování hypotéz: vytvoření velkého množství kandidátních odpovědí na základě různých zdrojů a patternů.
  • Vyhledávání důkazů: extrakce podpůrných informací z databází a textů (unstructured a semi-structured data).
  • Hodnocení a škálování: použití stovek statistických modelů a strojového učení pro přiřazení skóre a odhad pravděpodobnosti správnosti každé hypotézy.
  • Odhad důvěry: konečné určení míry jistoty (confidence) pro každou odpověď, podle níž se rozhoduje o „zabzučení“ (zahájení odpovědi).

Architektura Watsona byla paralelní a škálovatelná; systém běžel na clusteru výkonných serverů IBM (přes 2000 procesorových jader, konkrétně 2880 jader) a využíval desítky terabajtů operační paměti (přibližně 16 TB), aby mohl v reálném čase zpracovávat velké množství textu a hodnotit mnoho hypotéz současně.

Data a trénink

Během hry měl Watson přístup k 200 milionům stránek obsahu, včetně úplného textu Wikipedie. Zdrojem informací pro Watsona byly encyklopedie, slovníky, tezaury, zpravodajské články a knihy. Data byla předzpracována, indexována a anotována tak, aby je systémy Watsonu dokázaly rychle vyhledávat a porovnávat. Systém se učil vážit různé typy důkazů na základě předchozího tréninku a validace na historických datech.

Soutěž Jeopardy! (únor 2011)

Watson se v soutěži postavil proti lidským soupeřům Kenu Jenningsovi a Bradu Rutterovi; zápasy proběhly v polovině února 2011 a byly odvysílány během několika dní. V kontrastu s lidmi nebyl Watson v době soutěže připojen k internetu — používal pouze informace nahrané do jeho systému před zápasem. U každé nápovědy se na televizní obrazovce zobrazily tři nejpravděpodobnější odpovědi Watsona a míra jeho důvěry v tyto odpovědi. Pokud byla jeho důvěra v odpověď dostatečně vysoká, systém „stiskl“ elektronický buzzer a poskytl odpověď v požadovaném formátu (v Jeopardy! obvykle ve formě otázky).

Průběh a význam výsledku

Watsonova výhra měla silný mediální a odborný dopad. Ukázala, že systémy založené na statistické analýze přirozeného jazyka a strojovém učení mohou v konkurenčních podmínkách dosahovat výkonu srovnatelného s vrcholovými lidskými odborníky v úzké doméně. Zároveň ale výsledky upozornily na rozdíl mezi rychlým zpracováním textu a skutečným porozuměním světu — Watson fungoval jako vysoce sofistikovaný pattern‑matcher a hodnotič důkazů, nikoli jako obecně inteligentní entita disponující „běžným zdravým rozumem“.

Aplikace a následky

Po úspěchu v Jeopardy! IBM transformovala technologii Watson do komerčních produktů a řešení v oblastech jako zdravotnictví (podpora diagnostiky a analýzy lékařských textů), zákaznický servis, finanční analýzy a správa znalostí. Značka „Watson“ se stala zastřešujícím názvem pro sadu analytických a AI nástrojů. Komerční nasazení mělo smíšené výsledky — v některých oblastech byla technologie přínosná, jinde se projevily omezení v robustnosti, přenositelnosti modelů a nutnosti kvalitních tréninkových dat.

Omezení a kritika

  • Watson někdy dával chybnou nebo absurdní odpověď u nápověd vyžadujících komplexní kontext nebo „zdravý rozum“.
  • Systém byl citlivý na kvalitu a pokrytí tréninkových zdrojů — pokud v datech chyběly určité druhy informací, Watson je nedokázal doplnit.
  • Komerční využití vyžadovalo značné úsilí na přizpůsobení modelů konkrétním doménám a integraci s existujícími pracovními postupy.

Navzdory omezením Watson významně posunul hranice praktického využití zpracování přirozeného jazyka a obnovil zájem veřejnosti i průmyslu o možné aplikace umělé inteligence v reálném světě.

Zaměstnanci IBM testují systém Watson.Zoom
Zaměstnanci IBM testují systém Watson.

Otázky a odpovědi

Otázka: Co je to Watson?


Odpověď: Watson je uměle inteligentní počítačový systém, který dokáže odpovídat na otázky položené v přirozeném jazyce.

Otázka: Kdo vytvořil systém Watson?


Odpověď: Watson vyrobila společnost IBM.

Otázka: Jaký byl účel Watsona v soutěži Jeopardy!?


Odpověď: Účelem Watsona v soutěži Jeopardy! bylo soupeřit s minulými šampiony Kenem Jenningsem a Bradem Rutterem.

Otázka: Vyhrál Watson v soutěži Jeopardy!?


Odpověď: Ano, Watson vyhrál v soutěži Jeopardy! první místo ve výši 1 milionu dolarů.

Otázka: Po kom byl Watson pojmenován?


Odpověď: Watson byl pojmenován po Thomasi J. Watsonovi, který byl v letech 1914 až 1956 předsedou a generálním ředitelem společnosti IBM.

Otázka: Jaké zdroje informací používal Watson k zodpovězení otázek?


Odpověď: Zdrojem informací pro Watsona byly encyklopedie, slovníky, tezaury, zpravodajské články a knihy.

Otázka: Byl Watson během soutěže Jeopardy! připojen k internetu?


Odpověď: Ne, Watson nebyl během soutěže Jeopardy! připojen k internetu, což znamená, že k zodpovězení nápověd musel použít to, co měl ve svém systému.


Vyhledávání
AlegsaOnline.com - 2020 / 2025 - License CC3