Řízené přirozené jazyky (CNL, Controlled Natural Languages) jsou varianty přirozeného jazyka, v nichž jsou záměrně omezeny gramatika a slovní zásoba tak, aby se snížila nebo odstranila dvojznačnost a nadbytečná složitost. Cílem je zachovat čitelnost a srozumitelnost pro lidi a současně umožnit automatickou zpracovatelnost textu počítači — například pro přesnou sémantickou analýzu, ověřování nebo převod do formálních reprezentací.

Hlavní typy řízených přirozených jazyků

Obecně rozlišujeme dva hlavní typy CNL podle účelu a stupně formalizace:

  • Zjednodušené (technické) jazyky — jejich cílem je usnadnit porozumění textu lidem, zejména nerodilým mluvčím, a zlepšit kvalitu technické dokumentace a překladů. Obsahují pravidla pro styl, omezený slovník a doporučení typu „pište krátké a jednoduché věty“, „používejte aktivní rod“ nebo „uveďte konkrétní jméno osoby (např. John Smith) místo neurčitého »on«“. Mezi dobře známé příklady patří Simplified Technical English (ASD-STE), Caterpillar Technical English a IBM Easy English.
  • Formálně definované CNL — tyto jazyky mají přesně specifikovanou syntaxi a sémantiku a často se dají přímo přeložit do formálních logik (např. logika prvního řádu). Jsou navrženy tak, aby je bylo možné automaticky analyzovat, validovat a z nich odvozovat závěry. Typickým příkladem je Attempto Controlled English (ACE), které umožňuje převod vět na deterministickou reprezentaci v logice.

Klíčová pravidla a principy návrhu

  • Omezená slovní zásoba: používají se pouze definovaná slova a termíny, často včetně povinných definic terminologie.
  • Jednoduchá syntax: omezení typů vět (např. jedna hlavní věta bez vnořených konstrukcí), přednost aktivního rodu, zákaz elipsy a nejednoznačných zájmen.
  • Konzistence termínů: jednoznačné pojmenování konceptů (jedno slovo = jeden pojem).
  • Formální mapování: u formálních CNL existují přesná pravidla pro převod do logických výrazů nebo jiných formálních modelů.

Příklady a aplikace

  • Technická dokumentace a manuály — zlepšení čitelnosti, snížení chyb v údržbě a jednodušší mezinárodní překládání.
  • Strojová sémantická analýza a ontologie — automatické extrahování faktů, tvorba znalostních bází a převod vět na logické formule.
  • Požadavky softwaru a právní texty — přesnější formulace požadavků, méně nejasností při verifikaci.
  • Interakce s počítačem — dotazovací jazyky a rozhraní pro vyhledávání (přirozeně vypadající, ale přesně zpracovatelné dotazy).
  • Řídicí fráze v letectví či průmyslu — standardizované formulace pro bezpečnost a provoz.

Formální převod a příklad

U formálních CNL je možné větu převést do logiky. Příklad (v překladu do češtiny):

„Každý student navštěvuje alespoň jeden kurz.“

Tuto větu lze formalizovat v logice prvního řádu například takto: ∀x (Student(x) → ∃y (Course(y) ∧ attends(x,y))). Takové mapování umožňuje automatické odvozování závěrů a kontroly konzistence.

Výhody a nevýhody

  • Výhody:
    • menší riziko nejednoznačnosti,
    • lepší automatická zpracovatelnost a přesnost při vyhledávání informací,
    • snazší překlad a údržba technické dokumentace,
    • možnost formální verifikace.
  • Nevýhody:
    • omezená vyjadřovací síla v porovnání s plným přirozeným jazykem,
    • může znít nepřirozeně nebo kostrbatě pro lidské čtenáře,
    • požadavky na školení autorů a udržování slovníku a pravidel.

Závěr

Řízené přirozené jazyky představují kompromis mezi srozumitelností pro lidi a přesností pro stroje. Jsou užitečné tam, kde je nutné kombinovat lidské čtení s automatickou analýzou, například v technické dokumentaci, požadavcích na software, znalostních systémech nebo v aplikacích pro semantic web. Volba vhodného typu CNL závisí na tom, zda je hlavním cílem zlepšení čitelnosti pro lidi, nebo dosažení formální zpracovatelnosti a verifikovatelnosti.