Zákon Zipf – Mandelbrot - Zipf–Mandelbrot law
Parametry |
( celé číslo ) ( skutečné ) ( skutečné ) |
||
---|---|---|---|
Podpěra, podpora | |||
PMF | |||
CDF | |||
Znamenat | |||
Režim | |||
Entropie |
V teorii pravděpodobnosti a statistice je zákon Zipf-Mandelbrot je diskrétní rozdělení pravděpodobnosti . Rovněž známý jako Paretův- Zipfův zákon, je to distribuce mocninového práva na hodnocených datech , pojmenovaná po lingvistovi George Kingsley Zipfovi, který navrhl jednodušší distribuci zvanou Zipfův zákon , a matematik Benoit Mandelbrot , který jej následně zobecnil.
Funkce pravděpodobnostní hmotnosti je dána vztahem:
kde je dáno:
což lze považovat za zobecnění harmonického čísla . Ve vzorci je pořadí dat a a jsou parametry distribuce. V limitu, jak se blíží nekonečnu, se z toho stane funkce Hurwitz zeta . Konečný a zákon Zipf – Mandelbrot se stává zákonem Zipf . Pro nekonečno a stává se distribucí Zeta .
Aplikace
Distribuce slov seřazených podle jejich frekvence v náhodném textovém korpusu je aproximována distribucí mocninného práva , známou jako Zipfův zákon .
Pokud někdo vykreslí frekvenční pořadí slov obsažených ve středně velkém korpusu textových dat versus počet výskytů nebo skutečných frekvencí, získá distribuci zákonu moci s exponentem blízkým jedné (viz Powers, 1998 a Gelbukh & Sidorov, 2001). Zipfův zákon implicitně předpokládá pevnou velikost slovníku, ale harmonická řada se s = 1 nekonverguje, zatímco Zipf – Mandelbrotova zobecnění se s > 1 ano. Dále existují důkazy, že uzavřená třída funkčních slov, která definují jazyk, se řídí distribucí Zipf – Mandelbrot s různými parametry od otevřených tříd obsahových slov, která se liší podle tématu, pole a registru.
V ekologických terénních studiích se relativní distribuce hojnosti (tj. Graf počtu pozorovaných druhů jako funkce jejich hojnosti) často shledává v souladu se zákonem Zipf – Mandelbrot.
V hudbě odpovídá mnoho metrik měření „příjemné“ hudby distribucím Zipf – Mandelbrot.
Poznámky
Reference
-
Mandelbrot, Benoît (1965). "Informační teorie a psycholingvistika". V BB Wolman a E. Nagel (ed.). Vědecká psychologie . Základní knihy. Přetištěno jako
- Mandelbrot, Benoît (1968) [1965]. "Informační teorie a psycholingvistika". V RC Oldfield a JC Marchall (ed.). Jazyk . Knihy tučňáků.
- Powers, David MW (1998). "Aplikace a vysvětlení zákona Zipf". Nové metody zpracování jazyků a výpočetní výuka přirozeného jazyka . Společná konference o nových metodách zpracování jazyků a výpočetní výuce přirozeného jazyka. Sdružení pro výpočetní lingvistiku . 151 až 160.
- Zipf, George Kingsley (1932). Vybrané studie o principu relativní frekvence v jazyce . Cambridge, MA: Harvard University Press.
- Van Droogenbroeck FJ, „Zásadní přeformulování zákona Zipf – Mandelbrot k řešení žádostí o autorské atribuce podle Gaussovy statistiky“ (2019) [1]