Zákon Zipf – Mandelbrot - Zipf–Mandelbrot law

Zipf – Mandelbrot
Parametry ( celé číslo ) ( skutečné ) ( skutečné )

Podpěra, podpora
PMF
CDF
Znamenat
Režim
Entropie

V teorii pravděpodobnosti a statistice je zákon Zipf-Mandelbrot je diskrétní rozdělení pravděpodobnosti . Rovněž známý jako Paretův- Zipfův zákon, je to distribuce mocninového práva na hodnocených datech , pojmenovaná po lingvistovi George Kingsley Zipfovi, který navrhl jednodušší distribuci zvanou Zipfův zákon , a matematik Benoit Mandelbrot , který jej následně zobecnil.

Funkce pravděpodobnostní hmotnosti je dána vztahem:

kde je dáno:

což lze považovat za zobecnění harmonického čísla . Ve vzorci je pořadí dat a a jsou parametry distribuce. V limitu, jak se blíží nekonečnu, se z toho stane funkce Hurwitz zeta . Konečný a zákon Zipf – Mandelbrot se stává zákonem Zipf . Pro nekonečno a stává se distribucí Zeta .

Aplikace

Distribuce slov seřazených podle jejich frekvence v náhodném textovém korpusu je aproximována distribucí mocninného práva , známou jako Zipfův zákon .

Pokud někdo vykreslí frekvenční pořadí slov obsažených ve středně velkém korpusu textových dat versus počet výskytů nebo skutečných frekvencí, získá distribuci zákonu moci s exponentem blízkým jedné (viz Powers, 1998 a Gelbukh & Sidorov, 2001). Zipfův zákon implicitně předpokládá pevnou velikost slovníku, ale harmonická řada se s = 1 nekonverguje, zatímco Zipf – Mandelbrotova zobecnění se s > 1 ano. Dále existují důkazy, že uzavřená třída funkčních slov, která definují jazyk, se řídí distribucí Zipf – Mandelbrot s různými parametry od otevřených tříd obsahových slov, která se liší podle tématu, pole a registru.

V ekologických terénních studiích se relativní distribuce hojnosti (tj. Graf počtu pozorovaných druhů jako funkce jejich hojnosti) často shledává v souladu se zákonem Zipf – Mandelbrot.

V hudbě odpovídá mnoho metrik měření „příjemné“ hudby distribucím Zipf – Mandelbrot.

Poznámky

Reference

  • Mandelbrot, Benoît (1965). "Informační teorie a psycholingvistika". V BB Wolman a E. Nagel (ed.). Vědecká psychologie . Základní knihy. Přetištěno jako
    • Mandelbrot, Benoît (1968) [1965]. "Informační teorie a psycholingvistika". V RC Oldfield a JC Marchall (ed.). Jazyk . Knihy tučňáků.
  • Powers, David MW (1998). "Aplikace a vysvětlení zákona Zipf". Nové metody zpracování jazyků a výpočetní výuka přirozeného jazyka . Společná konference o nových metodách zpracování jazyků a výpočetní výuce přirozeného jazyka. Sdružení pro výpočetní lingvistiku . 151 až 160.
  • Zipf, George Kingsley (1932). Vybrané studie o principu relativní frekvence v jazyce . Cambridge, MA: Harvard University Press.
  • Van Droogenbroeck FJ, „Zásadní přeformulování zákona Zipf – Mandelbrot k řešení žádostí o autorské atribuce podle Gaussovy statistiky“ (2019) [1]

externí odkazy