Značkovač trigramů - Trigram tagger

Ve výpočetní lingvistice je trigram tagger statistická metoda pro automatickou identifikaci slov jako podstatných jmen, sloves, adjektiv, adverbií atd. Na základě markovských modelů druhého řádu, které berou v úvahu trojice po sobě jdoucích slov. Je vyškolen v textovém korpusu jako metoda předvídat další slovo, přičemž součin pravděpodobnosti unigram , Bigram a trigram . V rozpoznávání řeči jsou algoritmy využívající trigram-tagger skóre lepší než algoritmy využívající IIMM tagger, ale méně dobře než Net tagger.

Popis tagu trigramů poskytuje Brants (2000).

Reference

  • Kempe Andre (1993). "Náhodný tagger a analýza chyb při označování". Interní papír. Institute for Computational Linguistics, Universität Stuttgart.
  • Brants, T. (2000) TnT - A Statistics Part-of-Speech Tagger , Proc 6th Applied Natural Language Processing Conference, ANLP-200

externí odkazy