Gramatika operátora - Operator grammar

Operátorská gramatika je matematická teorie lidského jazyka, která vysvětluje, jak jazyk nese informace . Tato teorie je vyvrcholením celoživotního díla Zelliga Harrisa s hlavními publikacemi na konci minulého století. Gramatika operátora navrhuje, aby každý lidský jazyk byl samoorganizující se systém, ve kterém jsou jak syntaktické, tak sémantické vlastnosti slova stanoveny čistě ve vztahu k jiným slovům. K definici pravidel jazyka tedy není nutný žádný externí systém ( metajazyk ). Místo toho se tato pravidla učí prostřednictvím vystavení používání a prostřednictvím účasti, jako je tomu u většiny sociálního chování . Tato teorie je v souladu s myšlenkou, že jazyk se vyvíjel postupně, přičemž každá následující generace zaváděla novou složitost a variaci.

Operátorská gramatika předpokládá tři univerzální omezení: závislost (určitá slova závisí na přítomnosti jiných slov, která tvoří promluvu), pravděpodobnost (některé kombinace slov a jejich závislých jsou pravděpodobnější než jiné) a redukce (slova s ​​vysokou pravděpodobností lze omezit) na kratší formy a někdy úplně vynechány). Společně poskytují teorii jazykových informací : závislost vytváří strukturu predikátu a argumentu ; pravděpodobnost vytváří odlišné významy; redukce umožňuje kompaktní formy komunikace.

Závislost

Základním mechanismem gramatiky operátorů je omezení závislosti: určitá slova ( operátory ) vyžadují, aby bylo v promluvě přítomno jedno nebo více slov (argumentů). Ve větě John nosí boty , operátor nosí vyžaduje přítomnost dvou argumentů, jako je John a boty . (Tato definice závislosti se liší od ostatních závislostních gramatik, ve kterých se říká, že argumenty závisí na operátorech.)

V každém jazyce vede závislostní vztah mezi slovy k syntaktickým kategoriím, ve kterých jsou definovány přípustné argumenty operátoru z hlediska jejich požadavků na závislost. Třída N obsahuje slova (např. John , boty ), která nevyžadují přítomnost dalších slov. Třída O N obsahuje slova (např klopýtnutí ), které vyžadují přesně jedno slovo typu N. Třída O NN obsahuje slova (např opotřebení ), které vyžadují dvě slova typu N. Třída O OO obsahuje slova (např protože ), které vyžadují dva slova typu O, jako u Johna klopýtá, protože John má boty . Mezi další skupiny patří O O (např je možný ), O NNN (např put ), O ON (například s ), O NO (např know ), o NNO (např ptát ) a O noo (např atribut ).

Kategorie v gramatice operátorů jsou univerzální a jsou definovány čistě z hlediska vztahu slov k jiným slovům a nespoléhají se na externí sadu kategorií, jako je podstatné jméno, sloveso, adjektivum, příslovce, předložka, spojka atd. Vlastnosti závislosti každého slova lze pozorovat pomocí použití, a proto je možné se jej naučit.

Pravděpodobnost

Omezení závislosti vytvoří strukturu (syntaxi), ve které může být jakékoli slovo příslušné třídy argumentem pro daný operátor. Omezení pravděpodobnosti klade na tuto strukturu další omezení tím, že zvyšuje pravděpodobnost některých kombinací operátor / argument než jiných. Takže John nosí klobouky je pravděpodobnější než John nosí sníh, což je zase pravděpodobnější než John nosí dovolenou . Omezení pravděpodobnosti vytváří význam (sémantiku) tím, že definuje každé slovo z hlediska slov, která může brát jako argumenty, nebo z nichž to může být argument.

Každé slovo má jedinečnou sadu slov, u kterých bylo pozorováno, že se vyskytují, nazývané jeho výběr . Koherentní výběr slova je množina slov, pro které je vztah závislost má nadprůměrný pravděpodobnosti. Slova, která mají podobný význam, mají podobný koherentní výběr. Tento přístup k významu je samoorganizující se v tom smyslu, že není potřeba žádný externí systém k definování toho, co slova znamenají. Místo toho je význam slova určen jeho použitím v populaci mluvčích. Vzory častého používání jsou pozorovatelné, a proto se je lze naučit. Nová slova lze zavést kdykoli a definovat pomocí použití.

V tomto smyslu by se na spojovací gramatiku dalo pohlížet jako na druh operátorské gramatiky, protože spojení slov je určováno výhradně jejich kontextem a že každému výběru je přiřazena logaritmická pravděpodobnost.

Snížení

Omezení redukce působí na kombinace vysoce pravděpodobných operátorů a argumentů a vytváří kompaktnější formy. Některá zmenšení umožňují úplně vynechat slova z promluvy. Například očekávám , že John přijde, je redukovatelný na toho, jak očekávám Johna , protože přijít je velmi pravděpodobné za očekávání . Věta John nosí boty a John nosí klobouky lze snížit na John nosí boty a klobouky, protože opakování prvního argumentu John pod operátorem a je velmi pravděpodobné. John reads things can be reduced to John reads , because the argument things has Vysoká pravděpodobnost výskytu u jakéhokoli operátora.

Určité redukce redukují slova na kratší tvary a vytvářejí zájmena, přípony a předpony ( morfologie ). John nosí boty a John nosí klobouky může být snížena na Johna nosí boty a nosí klobouky , kde zájmeno on je redukovaná forma John . Přípony a předpony lze získat připojením dalších volně se vyskytujících slov nebo jejich variant. John se může líbit může být redukován na Johna je sympatický . John je přemýšlivý se sníží ze John je plná myšlenek , a John je protiválečná ze John je proti válce .

Modifikátory jsou výsledkem několika těchto druhů redukcí, které vedou k adjektivům, příslovcům, předložkovým frázím , vedlejším větám atd.

  1. John nosí boty; boty jsou z kůže (dvě věty spojené operátorem středníku ) →
  2. John nosí kožené boty (redukce opakovaného podstatného jména na relativní zájmeno ) →
  3. John nosí boty z kůže (vynechání vysoká pravděpodobnost, fráze , které jsou ) →
  4. John nosí kožené boty (vynechání vysoké operátor pravděpodobnosti části , provedení krátkého modifikátor vlevo od podstatného jména)

Každý jazyk má jedinečnou sadu redukcí. Například některé jazyky mají morfologii a jiné ne; některé transponují krátké modifikátory a jiné ne. Každé slovo v jazyce se účastní pouze určitých druhů redukcí. V každém případě však lze redukovaný materiál rekonstruovat ze znalosti toho, co je pravděpodobné v dané kombinaci operátor / argument. Redukce, kterých se každé slovo účastní, jsou pozorovatelné, a proto se je dají naučit, stejně jako se člověk naučí vlastnosti závislosti a pravděpodobnosti slova.

Informace

Důležitost zmenšení gramatiky operátora spočívá v tom, že oddělují věty, které obsahují zmenšené tvary, od těch, které nikoli (základní věty). Všechna redukce jsou parafráze , protože neodstraňují žádné informace, pouze činí věty kompaktnějšími. Základní věty tedy obsahují všechny informace o jazyce a redukované věty jsou jejich variantami. Základní věty jsou tvořeny jednoduchými slovy bez úprav a do značné míry bez přípon, např. Sněžení , ovce jí trávu , John ví , že ovce jí trávu , že ovce sněží, Johna překvapí .

Každý operátor ve větě přispívá svými argumenty informacemi podle své pravděpodobnosti výskytu. Vysoce očekávané kombinace mají málo informací; vzácné kombinace mají vysokou informaci. Přesný příspěvek operátora je určen jeho výběrem, množinou slov, s nimiž se vyskytuje s vysokou frekvencí. Argumenty boty , klobouky , ovce , tráva a sníh se významově liší podle operátorů, u nichž se mohou s vysokou pravděpodobností objevit v pozici prvního nebo druhého argumentu. Například sníh se očekává jako první argument pádu, ale ne jídla , zatímco u ovcí je tomu naopak . Obdobně se provozovatelé stravují , hltají , žvýkají a polykají, což se liší v rozsahu, v jakém se liší argumenty, které vyberou, a provozovatelé, kteří je vyberou.

Gramatika operátora předpovídá, že informace nesená větou je kumulací příspěvků každého argumentu a operátora. Přírůstek informace, kterou dané slovo přidá k nové větě, je určen tím, jak bylo použito dříve. Nová použití zase roztahuje nebo dokonce mění informační obsah spojený se slovem. Protože tento proces je založen na vysokofrekvenčním použití, významy slov jsou v průběhu času relativně stabilní, ale mohou se měnit v souladu s potřebami jazykové komunity.

Bibliografie

  • Harris , Zellig (1982), A Grammar of English on Mathematical Principles , New York: John Wiley and Sons, ISBN   0-471-02958-0
  • Harris , Zellig (1988), Language and Information , New York: Columbia University Press, ISBN   0-231-06662-7
  • Harris , Zellig (1989), Forma informací ve vědě: Analýza imunologického dílčího jazyka , Springer, ISBN   90-277-2516-0
  • Harris , Zellig (1991), Teorie jazyka a informací: Matematický přístup , Oxford University Press, USA, ISBN   0-19-824224-7