Značkovač trigramů - Trigram tagger
Ve výpočetní lingvistice je trigram tagger statistická metoda pro automatickou identifikaci slov jako podstatných jmen, sloves, adjektiv, adverbií atd. Na základě markovských modelů druhého řádu, které berou v úvahu trojice po sobě jdoucích slov. Je vyškolen v textovém korpusu jako metoda předvídat další slovo, přičemž součin pravděpodobnosti unigram , Bigram a trigram . V rozpoznávání řeči jsou algoritmy využívající trigram-tagger skóre lepší než algoritmy využívající IIMM tagger, ale méně dobře než Net tagger.
Popis tagu trigramů poskytuje Brants (2000).
Reference
- Kempe Andre (1993). "Náhodný tagger a analýza chyb při označování". Interní papír. Institute for Computational Linguistics, Universität Stuttgart.
- Brants, T. (2000) TnT - A Statistics Part-of-Speech Tagger , Proc 6th Applied Natural Language Processing Conference, ANLP-200
externí odkazy
- TnT - statistické značení části řeči od Thorsten Brants
Tento článek týkající se výpočetní lingvistiky je útržek . Wikipedii můžete pomoci rozšířením . |