Cepstrum - Cepstrum

V Fourierova analýza je cepstrum ( / k ɛ p y t r ʌ m , to ɛ p -, - s t r ə m / ; množné cepstra , adjektivum cepstrální ) je výsledkem práce na počítači inverzní Fourierovy transformace (IFT) na logaritmu odhadované spektra signálu . Tato metoda je nástrojem pro zkoumání periodických struktur ve frekvenčních spektrech. Výkon cepstrum má aplikace při analýze lidské řeči .

Termín cepstrum byl odvozen obrácením prvních čtyř písmen spektra . Operace na cepstra jsou označeny jako analýza více měn (nebo alanysis pro více měn ), zvedání nebo cepstrální analýza . Lze jej vyslovit dvěma způsoby, přičemž druhý má tu výhodu, že se vyhne záměně s kepstrumem .

Kroky ve formování cepstrum z historie času

Původ

Koncept cepstrum byl představen v roce 1963 společnostmi BP Bogert, MJ Healy a JW Tukey . Slouží jako nástroj ke zkoumání periodických struktur ve frekvenčních spektrech. Takové efekty souvisejí se znatelnými echy nebo odrazy v signálu nebo s výskytem harmonických frekvencí ( dílčí , podtóny ). Matematicky se zabývá problémem dekonvoluce signálů ve frekvenčním prostoru.

Odkazy na Bogertův papír v bibliografii jsou často upravovány nesprávně. Pojmy „quefrency“, „alanysis“, „cepstrum“ a „saphe“ byly vynalezeny autory přeskupením písmen ve frekvenci, analýze, spektru a fázi. Vynalezené termíny jsou definovány analogicky ke starším termínům.

Název cepstrum byl odvozen obrácením prvních čtyř písmen spektra . Operace na cepstře jsou označeny jako analýza více měn (aka analýza afény ), zvedání nebo cepstrální analýza . Může být vyslovováno dvěma způsoby, přičemž druhý má tu výhodu, že se vyhne záměně s kepstrumem .

Obecná definice

Cepstrum je výsledkem následující sekvence matematických operací:

Typy

Cepstrum se používá v mnoha variantách. Nejdůležitější jsou:

  • silové cepstrum: logaritmus je převzat z „energetického spektra“
  • komplexní cepstrum: Logaritmus je převzat ze spektra, které je vypočítáno Fourierovou analýzou

Následující vzorce jsou použity ve vzorcích k vysvětlení cepstrumu:

Zkratka Vysvětlení
Signál, který je funkcí času
Cepstrum
Fourierova transformace : Zkratka může znamenat spojitou Fourierovu transformaci , diskrétní Fourierovu transformaci (DFT) nebo dokonce z-transformaci , protože z-transformace je zobecněním DFT.
Inverzní k Fourierově transformaci
Logaritmus o x . Volba základny b závisí na uživateli. V některých článcích není základna specifikována, jiní preferují základnu 10 nebo  e . Volba základny nemá žádný vliv na základní pravidla výpočtu, ale někdy báze e vede ke zjednodušení (viz „komplexní cepstrum“).
Absolutní hodnota neboli velikost komplexní hodnoty , která se vypočítává z reálné a imaginární části pomocí Pythagorovy věty .
Absolutní čtverec
Fázový úhel komplexní hodnoty

Power cepstrum

„Cepstrum“ bylo původně definováno jako mocenské cepstrum následujícím vztahem:

Power cepstrum má hlavní aplikace v analýze zvukových a vibračních signálů. Jedná se o doplňkový nástroj ke spektrální analýze.

Někdy je také definován jako:

Díky tomuto vzorci je cepstrum také někdy nazýváno spektrem spektra . Je možné ukázat, že oba vzorce jsou navzájem konzistentní, protože spektrální distribuce frekvencí zůstává stejná, jediným rozdílem je faktor škálování, který lze použít později. Některé články dávají přednost druhému vzorci.

Jsou možné i jiné zápisy vzhledem k tomu, že log výkonového spektra se rovná logu spektra, pokud se použije měřítkový faktor 2:

a proto:

který poskytuje vztah ke skutečnému cepstrumu (viz níže).

Dále je třeba poznamenat, že konečná kvadratická operace ve vzorci pro výkonové spektrum je někdy nazývána zbytečnou, a proto je někdy vynechána.

Real cepstrum je přímo závislá na výkonu cepstru:

Je odvozen z komplexu cepstru (definované níže) o vyřazení fázovou informaci (obsažené v imaginární části komplexního logaritmu ). Zaměřuje se na periodické efekty v amplitudách spektra:

Složité cepstrum

Komplex cepstrum byl definován Oppenheim v jeho vývoji homomorfní teorie systémů. Vzorec je poskytnut také v jiné literatuře.

Jelikož je logický termín složitý, lze jej zapsat také jako součin velikosti a fáze a následně jako součet. Další zjednodušení je zřejmé, pokud je log přirozený logaritmus se základnou  e :

Proto: Složité cepstrum lze také zapsat jako:

Složité cepstrum uchovává informace o fázi. Proto je vždy možné vrátit se z domény quefrency do časové domény inverzní operací:

kde b je základ použitého logaritmu.

Hlavní aplikací je modifikace signálu v doméně quefrency (zvedání) jako analogová operace pro filtrování ve spektrální frekvenční oblasti. Příkladem je potlačení efektů ozvěny potlačením určitých měn.

Fáze cepstrum (po fázi spektra ), je spojena s komplexní cepstru jako

fázové spektrum = (komplexní cepstrum - časové obrácení komplexního cepstra) 2 .

Související pojmy

Nezávislá proměnná z kepstrální grafu se nazývá quefrency . Tato měna je měřítkem času, i když ne ve smyslu signálu v časové oblasti . Pokud je například vzorkovací frekvence zvukového signálu 44 100 Hz a v cepstru je velký vrchol, jehož kmitočet je 100 vzorků, vrchol indikuje přítomnost základní frekvence 44 100/100 = 441 Hz. Tento vrchol se vyskytuje v cepstru, protože harmonické ve spektru jsou periodické a perioda odpovídá základní frekvenci, protože harmonické jsou celočíselné násobky základní frekvence.

Kepstrum , což je zkratka pro „Kolmogorov-rovnice energie řady časové odezvy“, je podobný cepstru a má stejný vztah k ní, jak se očekávalo hodnotu je statistický průměr, tj cepstrum je empiricky měřená veličina, zatímco kepstrum je teoretická Množství. To bylo v provozu před Cepstrum.

Autocepstrum je definováno jako cepstrum autokorelace . Autocepstrum je při analýze dat s ozvěnami přesnější než cepstrum.

Při dalším přehrávání tématu anagramu lze filtr, který funguje na cepstrum, nazvat zvedák . Nízkoprůchodový zvedák je podobný nízkoprůchodovému filtru ve frekvenční oblasti . Může být implementován vynásobením okénkem v doméně quefrency a následným převodem zpět do frekvenční domény, což má za následek upravený signál, tj. Se snížením ozvěny signálu.

Výklad

Na cepstrum lze pohlížet jako na informaci o rychlosti změny v různých pásmech spektra. Původně byl vynalezen pro charakterizaci seismických ozvěn způsobených zemětřeseními a výbuchy bomb . Byl také použit ke stanovení základní frekvence lidské řeči a k ​​analýze návratů radarových signálů. Stanovení výšky tónu Cepstrum je obzvláště účinné, protože účinky vokální excitace (výška tónu) a vokálního traktu (formanty) jsou v logaritmu výkonového spektra aditivní a jsou tedy jasně oddělené.

Cepstrum je reprezentace používaná při zpracování homomorfního signálu k převodu signálů kombinovaných konvolucí (jako je zdroj a filtr) na součty jejich cepstra pro lineární oddělení. Zejména je výkonové cepstrum často používáno jako vektor funkcí pro reprezentaci lidského hlasu a hudebních signálů. U těchto aplikací se spektrum obvykle nejprve transformuje pomocí stupnice mel . Výsledek se nazývá cepstrum mel-Frequency nebo MFC (jeho koeficienty se nazývají mel-frequency cepstral coefficients, neboli MFCC). Používá se pro hlasovou identifikaci, detekci výšky tónu a mnoho dalšího. Cepstrum je v těchto aplikacích užitečné, protože nízkofrekvenční periodické buzení z hlasivek a formující filtrování vokálního traktu , které se v časové oblasti sdružují a ve frekvenční doméně se množí , jsou aditivní a v různých oblastech v doméně měnových měn .

Všimněte si, že čistou sinusovou vlnu nelze použít k testování cepstrumu pro stanovení jeho výšky z kmitočtu, protože čistá sinusová vlna neobsahuje žádné harmonické a nevede k vrcholům měn. Spíše by měl být použit testovací signál obsahující harmonické (jako je součet alespoň dvou sinusů, kde druhý sinus je nějaká harmonická (násobek) prvního sinusu, nebo lépe signál se čtvercovým nebo trojúhelníkovým průběhem, jako takové signály poskytnout mnoho podtónů ve spektru.).

Důležitou vlastností cepstrální domény je, že konvoluce dvou signálů může být vyjádřena jako přidání jejich komplexní cepstra:

Aplikace

Koncept cepstrum vedl k mnoha aplikacím:

  • zabývající se odvozováním odrazu (radar, aplikace sonaru, seismologie Země)
  • odhad základní frekvence (výšky) reproduktoru
  • analýza a rozpoznávání řeči
  • lékařské aplikace při analýze elektroencefalogramu (EEG) a mozkových vln
  • analýza vibrací stroje na základě harmonických vzorců (poruchy převodovky, poruchy lopatek turbíny, ...)

Nedávno byla použita dekonvoluce založená na cepstrumu k odstranění účinku stochastických impulzních vlaků, které pocházejí ze signálu sEMG , z výkonového spektra samotného signálu sEMG. Tímto způsobem byly zachovány pouze informace o tvaru a amplitudě akčního potenciálu motorové jednotky (MUAP) a poté použity k odhadu parametrů modelu časové domény samotného MUAP.

Krátkodobá analýza cepstrum byla navržena Schroederem a Nollem pro aplikaci pro stanovení výšky lidské řeči.

Reference

Další čtení