Nanosyntax - Nanosyntax

Nanosyntaxe je přístup k syntaxi, kde terminální uzly syntaktických parsovacích stromů mohou být redukovány na jednotky menší než morfém . Každá jednotka může být neredukovatelným prvkem a nemusí být povinna tvořit další „podstrom“. Díky redukci na nejmenší možný terminál jsou terminály menší než morfémy. Morfémy a slova proto nelze rozčlenit na jeden terminál a jsou naopak složeny z několika terminálů. Ve výsledku může Nanosyntax sloužit jako řešení jevů, které jsou nedostatečně vysvětleny jinými teoriemi syntaxe.

Některé nedávné práce v teoretické lingvistice naznačují, že „atomy“ syntaxe jsou mnohem menší než slova nebo morfémy. Z toho pak vyplývá, že odpovědnost za syntaxi se neomezuje pouze na objednávání „předem vytvořených“ slov. Místo toho jsou v rámci Nanosyntaxe slova odvozeny entity zabudované do syntaxe, nikoli primitivní prvky dodávané lexikonem.

Dějiny

Teoretické souvislosti

Nanosyntaxe vznikla v kontextu jiných syntaktických teorií, především kartografie a distribuované morfologie . Kartografické teorie syntaxe měly velký vliv na myšlenku nanosyntaxe a teorie sdílejí mnoho společných rysů. Kartografie se snaží poskytnout syntaktickou teorii, která zapadá do Universal Grammar , mapováním stavebních bloků a struktur syntaxe přítomných ve všech jazycích. Vzhledem k tomu, že kartografie je založena na empirických důkazech, byly vyvíjeny menší a podrobnější syntaktické jednotky a struktury, aby vyhovovaly novým jazykovým údajům. Kartografie také syntaktizuje různé domény gramatiky, zejména sémantiku, v různé míře v různých rámcích. Například prvky sémantiky, které slouží gramatickým funkcím, jako jsou prvky vyjadřující číslo, čas nebo velká a malá písmena, jsou považovány za součást sémantiky. Tento trend směrem k zahrnutí dalších gramatických domén do syntaxe se odráží také v Nanosyntaxi. Mezi další prvky kartografie, které jsou obsaženy v Nanosyntaxi, patří univerzální syntaktické kategorie sloučení a výlučné pravoúhlé stromy / pohyb vlevo. Kartografická syntaxe však konceptualizuje lexikon jako předsyntaktické úložiště, které kontrastuje s nanosyntaktickým pohledem na lexikon / syntaxi.

Architektura gramatiky v nanosyntaktické teorii.

Distribuovaná morfologie poskytuje alternativu k lexikalistickým přístupům k tomu, jak lexikon a syntaxe interagují, tj. Se slovy nezávisle vytvořenými v lexikonu a poté organizovanými pomocí syntaxe. V distribuované morfologii lexikon nefunguje samostatně a je místo toho distribuován do mnoha jazykových procesů. Distribuovaná morfologie i nanosyntaxe jsou modely pozdního vkládání, což znamená, že syntax je chápána jako předlexikální / fonologický proces, přičemž syntaktické kategorie jsou abstraktní pojmy. Obě teorie navíc považují syntaxi za odpovědnou za strukturu na úrovni vět i slov. Navzdory mnoha podobnostem se Nanosyntax a Distribuovaná morfologie stále liší v několika klíčových oblastech, zejména s ohledem na architekturu interakce gramatických domén. Distribuovaná morfologie využívá presynaktický seznam abstraktních kořenů, funkčních morfémů a vkládání slovíček, které následují syntaktické procesy. Naproti tomu Nanosyntax má syntaxi, morfologii a sémantiku fungující současně jako součást jedné domény, která v rámci syntaktického procesu interaguje s aplikací lexikálních prvků (lexikon je v Nanosyntaxi jedinou doménou, zatímco v distribuované morfologii je rozložen na více domén). Další informace najdete v části Nástroje nanosyntaxe níže.

Nanosyntaktická teorie je v přímém rozporu s teoriemi, které přijímají pohledy na lexikon jako na samostatnou doménu, která generuje lexikální záznamy kromě jakékoli jiné gramatické domény. Příkladem takové teorie je hypotéza lexikální integrity , která uvádí, že syntaxe nemá přístup k vnitřní struktuře lexikálních položek.

Uvažování

Podstrom pro idiom „uvázat uzel“, což znamená „oženit se“.

Přijetím teoretické architektury gramatiky, která neodděluje syntaktické, morfologické a sémantické procesy a umožněním terminálům reprezentovat sub-morfemické informace, je Nanosyntax vybaven k řešení různých nedostatků a oblastí nejistoty v předchozích teoriích. Jedním příkladem, který podporuje tyto nástroje Nanosyntaxe, jsou idiomy , ve kterých je jedna lexikální položka reprezentována pomocí více slov, jejichž význam nelze určit kumulativně. Protože terminály v Nanosyntaxi představují sub-morfemické informace, je jediný morfém schopen překlenout několik terminálů, čímž vytváří podstrom. To odpovídá struktuře idiomů, které jsou nejlépe reprezentovány jako podstrom představující jeden morfém.

Další důkazy o potřebě nanosyntaktické analýzy zahrnují analýzu nepravidelných tvarů podstatného jména a skloňování nepravidelných sloves (podrobněji popsáno v části Nanosyntaktické operace ) a analýza morfémů, které obsahují více gramatických funkcí (podrobněji popsáno v části Nástroje ).

Nanosyntaktické operace

Nanosyntax je teorie, která se snaží zaplnit díry, které zanechaly jiné teorie, když se snaží vysvětlit jevy v jazyce. Nejpozoruhodnějším jevem, který Nanosyntax řeší, je nepravidelná konjugace. Například „ husa “ je nepravidelná v tom, že její množné číslo není „husy“, ale spíše „husy“. To představuje problém jednoduché syntaxe, protože bez dalších pravidel a přídavků by „husy“ měly být považovány za neoptimální kandidáty na množné číslo „husa“ ve srovnání s „husami“.

Možné řešení

Existují tři způsoby, kterými se syntaktici mohou pokusit tento problém vyřešit. První je slovní léčba. Ve výše uvedených příkladech se „kachna“, „kachny“, „husa“ a „husy“ počítají jako samostatné hlavy v kategorii podstatných jmen . To, zda slovo označuje singulární nebo množné číslo, je pak označeno v lexikální položce a neexistuje číselná hlava, se kterou mohou být přidána přípony k úpravě kořenového slova. Tato teorie vyžaduje výraznou práci na straně mluvčího k získání správného slova. Rovněž je považován za nedostatek tváří v tvář morfologickým konceptům, jako jsou ty, které jsou zobrazeny Wugovým testem, kdy děti dokážou správně konjugovat dříve neslýchané nesmyslné podstatné jméno z jednotného čísla na množné.

Distribuovaná morfologie se pokouší vyřešit otázku procesem fúze. Fúze je proces, při kterém se hlavice podstatného jména a jeho hlavice číslice mohou spojit dohromady za určitých parametrů a odvodit nepravidelné množné číslo. Ve výše uvedeném příkladu by množné číslo „kachna“ jednoduše vybralo své množné číslo „alomorf“ „kachny“ a množné číslo „husa“ by vybralo své množné číslo „alomorf“ „husy“, vytvořené spojením „husí“ a „-s“ . Tímto způsobem je distribuovaná morfologie založená na hlavě. Tato teorie však stále neposkytuje důvod, proč jsou „husy“ výhodnější a optimálnější kandidát na větší počet hus než „hus“.

Nanosyntax jde o tomto dilematu tím, že naznačuje, že místo toho, aby každé slovo bylo hlavou, je to místo toho fráze, a proto z něj lze udělat podstrom. Ve stromu lze hlavám přiřadit přepsat jiné hlavy ve specifických kontextech. Například pokud existuje hlava, která říká „-s“, je přidána k podstatnému jménu, aby se změnila z podstatného jména v jednotném čísle na podstatné jméno v množném čísle, ale hlava jej přepíše v případě nepravidelně konjugovaného množného jména, jako je „husa“ , vybere pro provoz nahrazující hlavy. Vzhledem k tomu, že používá vzorec a nenamítá memorování lexikálních položek, obchází výzvy, které přináší slovní zacházení, a vzhledem k uspořádání hlav a jejich přednosti také poskytuje řešení obav o optimalitu distribuované morfologie.

Nanosyntaxové funkce založené na dvou principech: frázová lexikalizace a princip jinde.

Zde dochází k frázové lexikalizaci, kde může něco lexikalizovat jiné, pokud to vyhovuje jeho specifickým parametrům. V tomto příkladu mohou „husy“ lexikalizovat „NP husa + množné číslo NumP.“

Frázová lexikalizace

Frázová lexikalizace je koncept, který navrhuje, že koncové uzly mohou tvořit pouze lexikální položky. Při uplatnění tohoto principu můžeme říci, že u podstatných jmen v množném čísle neexistuje žádná speciální lexikalizace (označená v následujícím příkladu pomocí X), kterou je třeba použít, a proto platí standardní pravidla pluralizace. Následuje příklad použití výrazu „kachna“, kde, protože neexistuje žádná další lexikalizace podstatného jména v množném čísle, se k pluralizaci podstatného jména přidá znak -s:

Nepravidelná slovesa mohou být paralelní s fonologickými idiomy (příkladem jsou „husy“) a také mohou používat frázovou lexikalizaci.

X ↔ [ PlP [ NP DUCK] Pl kachna ↔ [ NP DUCK] (8) s ↔ Pl

Tento princip také umožňuje, aby slovo jako „husy“ lexikalizovalo [husa [Pl 0 ]. Pokud je k dispozici další lexikalizace, místo následování standardního přidání -s k pluralizaci podstatného jména převezme pravidlo lexikalizace následující způsob:

husy ↔ [ PlP [ NP GOOSE] Pl.

Princip kdekoli

Princip Jinde se snaží poskytnout řešení otázky, která lexikalizace platí pro dané podstatné jméno. Jednoduše řečeno, konkrétnější lexikalizace bude mít vždy přednost před obecnější lexikalizací.

Jak je znázorněno, syntaktická struktura S hledá buď lexikalizaci z A ↔ [ XP X [ YP Y [ ZP Z]]] nebo B ↔ [ YP Y [ ZP Z]], B zvítězí nad A, protože B lexikalizuje v konkrétnější situaci vzhledem k tomu, že lexikalizuje obecněji. Tím se vyřeší problém, kterému čelí Distribuovaná morfologie při určování optimální pluralizace nepravidelných podstatných jmen.

Pozorovatelné důsledky

Caha navrhl, aby existovala hierarchie v následujících případech od nejširší po nejužší: Dativní, Genitiv, Akuzativ, Nominativní. Caha také navrhl, že každý z těchto případů lze rozdělit do nejzákladnějších struktur, z nichž každý je syntaktický terminál, a to následovně:

Dative = [ WP W [ XP X [ YP Y [ ZP Z]]]] Genitiv = [ XP X [ YP Y [ ZP Z]]] Akuzativ = = [ YP Y [ ZP Z]] Nominativní = [ ZP Z]

To je dále popsáno v části Morfologická izolace / hnízdění tohoto článku na Wikipedii.

Protože každý je tvořen množinami uvnitř, je možné, aby části času byly lexikalizovány samostatným podstatným jménem. Proto existuje několik možností ve vzorcích synkretismu, jmenovitě AAAA, AAAB, AABB, ABBB, AABC, ABBC a ABCC. Některá ujednání se neobjevují jako možnosti z důvodu omezení stanovených principem Jinde. Je pozoruhodné, že jakmile došlo k přechodu na samostatnou lexikalizaci, lexikalizace z předchozího se nemohou vrátit. Jinými slovy, nedochází k žádným událostem, kdy se jednou A obrátí na B nebo B na C, A nebo B se znovu objeví. Princip Jinde říká, že užší lexikalizace zvítězí nad širšími lexikalizace, a jakmile bude vybrána užší lexikalizace, širší lexikalizace se znovu neobjeví.

Nástroje

Nanosyntax používá několik nástrojů k mapování jemnozrnných prvků analyzovaného jazyka. Kromě Spellout Principles existují pro tento systém tři hlavní nástroje založené na spisech Baunaza, Haegemana, De Clercqa a Landera v Exploring Nanosyntax .

Sémantika

Pro sémantické mapování struktury ve větách se používá univerzální struktura kompozičnosti. Jedná se o mapování, ze kterého jsou slova složena, například ze kterých struktur je dané slovo sémanticky „konstruováno“. Sémantické úvahy ovlivňují parametry strukturálního zabrání věty na základě sémantických kategorií věcí, jako jsou slovesa. Toto je důležitá vodicí funkce ohledně toho, jaké prvky syntaxe je třeba zarovnat pomocí sémantických značek.

Synkretismus

Synkretismus hrál ústřední roli ve vývoji nanosyntaxe. Tento systém kombinuje dvě odlišné morfosyntaktické struktury na povrchu věty: například dvě gramatické funkce obsažené v jediné lexikální formě. Příkladem toho může být něco jako francouzské „à“, kterým lze označit místo nebo cíl; jedná se tedy o synkretismus cíle a polohy. Toto pozorování synkretismu pochází z práce zkoumající vzorce čtení slov, jako je cíl „do“, směrování „přes“ a umístění „na“ křížově lingvisticky prováděné lingvistikou, jak navrhuje Svenonius.

Synkretismus případů byl na základě věty ABA stanoven jako možný pouze u sousedních případů. To proto lze použít k cílení na sousední prvky v pořadí případů, jako jsou jmenované a akuzativní případy v jazycích, jako je angličtina. Pomocí synkretismu v Nanosyntaxi lze identifikovat univerzální pořadí případů, a to určením toho, které případy sedí vedle sebe. Toto zjištění umožňuje lingvistům pochopit, které prvky jsou přítomny, a také jejich pořadí.

Morfologická izolace

Vnoření případů předpokládaných v Nanosyntaxi.

Morfologická izolace souvisí s hierarchií lineárního řádu ve syntaktických strukturách. Synkretismus může odhalit lineární zápach, ale není schopen určit, ve kterém směru se lineární řád vyskytuje. To je místo, kde je požadována morfologická izolace. V této souvislosti se používá k určení hierarchie případů. Synkretismus může určit lineární pořadí případů je COM> INS> DAT> GEN> ACC> NOM nebo NOM> ACC> GEN> DAT> INS> COM, ale morfologické zadržení rozhoduje o tom, zda je nominativní nebo komitativní iniciála. Tyto funkce případu lze chápat jako sady navzájem, kde funkce staví na sobě, přičemž první funkce je singleton, ale další funkce je první a druhá vnořená do sebe - a tak dále. Tyto sady lze označit jako výše uvedené funkce. Alternativně je pro zjednodušení vnoření funkcí lze označit jako K 1 / atd., Jak navrhuje Pavel Caha. Argumenty pro to, že Nominativní případ je nejjednodušší a první případ lze spojit s jeho jednoduchostí ve struktuře a vlastnostech. Příklady lze nalézt v přirozeném jazyce, které naznačují pořadí začínající NOM a končící COM, například ve West Tocharian, kde se nachází koncovka ACC množného čísla --m vnořená do koncovky GEN / DAT --mts. Toto je povrchová reprezentace řazení Case pomocí vnoření v Nanosyntaxi.

Viz také

Reference