Druhá odmocnina matice - Square root of a matrix

V matematiky je druhá odmocnina z matrice rozšiřuje pojem odmocniny z čísel do matric . Matice B se říká, že je druhá odmocnina z A, v případě, že matice produkt BB je rovna A .

Někteří autoři používají název odmocniny nebo zápis A 1/2 pouze pro konkrétní případ, kdy A je kladný semidefinit , pro označení jedinečné matice B, která je kladným semidefinitem a taková, že BB = B T B = A (pro skutečné hodnoty matice, kde B T je přemístit z B ).

Méně často se název odmocnina může být použit pro jakýkoliv faktorizace pozitivní semidefinitní matice A jako B T B = A , jako je tomu v Choleského faktorizaci , a to i v případě, BB ≠ A . Tento odlišný význam je diskutován v Positive definitite matrix § Decomposition .

Příklady

Matice může mít obecně několik odmocnin. Zejména v případě, pak stejně.

Matice identity 2 × 2 má nekonečně mnoho odmocnin. Jsou dány

a

kde jsou nějaká čísla (reálná nebo komplexní) taková, že . Zejména pokud je nějaká Pythagorova trojka - tj. Jakákoli sada kladných celých čísel, takže potom je druhá odmocnina matice, která je symetrická a má racionální položky. Tím pádem

Mínus identita má druhou odmocninu, například:

které lze použít k reprezentaci imaginární jednotky i a tedy všech komplexních čísel pomocí 2 × 2 reálných matic, viz Maticová reprezentace komplexních čísel .

Stejně jako u skutečných čísel nemusí skutečná matice mít skutečnou druhou odmocninu, ale má druhou odmocninu se složitými hodnotenými položkami. Některé matice nemají odmocninu. Příkladem je matice

Zatímco druhá odmocnina nezáporného celého čísla je buď opět celé nebo iracionální číslo , na rozdíl od toho může mít celočíselná matice druhou odmocninu, jejíž položky jsou racionální, ale neintegrované, jako v příkladech výše.

Pozitivní semidefinitové matice

Symetrická skutečná matice n × n se nazývá pozitivní semidefinit, pokud pro všechny (zde označuje transpozici , změnu sloupcového vektoru x na řádkový vektor). Čtvercová reálná matice je pozitivní semidefinitní právě tehdy, když pro některé matice B . Tam může být mnoho různých takových matrices B . Pozitivní semidefinitová matice A může mít také mnoho matic B tak, že . Nicméně A má vždy přesně jednu odmocninu B, která je kladný semidefinit (a tedy symetrický). Zejména proto, že B , kde musí být symetrická , takže obě podmínky nebo jsou rovnocenné.

U komplexně hodnocených matic se místo toho použije konjugovaná transpozice a kladné semidefinitové matice jsou hermitovské , což znamená .

Věta  -  Nechť A je pozitivní semidefinitní matice (skutečná nebo komplexní). Pak existuje přesně jedna pozitivní semidefinitová matice B taková, že .

Tato jedinečná matice se nazývá hlavní , nezáporná nebo kladná odmocnina (ta druhá v případě pozitivních jednoznačných matic ).

Hlavní odmocnina skutečné pozitivní semidefinitové matice je skutečná. Hlavní odmocnina pozitivní definitivní matice je kladná určitá; obecněji, pozice hlavního odmocnina A je stejná jako hodnosti A .

Operace převzetí hlavní odmocniny je na této sadě matic nepřetržitá. Tyto vlastnosti jsou důsledkem holomorfního funkčního počtu aplikovaného na matice. Existenci a jedinečnost hlavní odmocniny lze odvodit přímo z jordánské normální formy (viz níže).

Matice s odlišnými vlastními hodnotami

N x n matice s n výraznými nenulovou čísel má 2 n odmocniny. Taková matrice, , má eigendecomposition VDV -1 , kde V je matice, jejíž sloupce jsou vlastní vektory A a D je diagonální matice, jejíž diagonální prvky jsou odpovídající n vlastní hodnoty lambda i . Tak odmocnin A jsou dány VD 1/2 V -1 , kde D polovina je jakýkoli odmocnina matice D , které pro různých čísel, musí být diagonální s diagonální prvky, které se rovnají odmocnin diagonálních prvků z D ; protože existují dvě možné volby pro druhou odmocninu každého diagonálního prvku D , existují 2 n volby pro matici D 1/2 .

To také vede k důkazu výše uvedeného pozorování, že matice s jednoznačnou definicí má přesně jednu druhou odmocninu s pozitivní definicí: pozitivní definitivní matice má pouze kladná vlastní čísla a každé z těchto vlastních čísel má pouze jednu kladnou odmocninu; a protože vlastní čísla druhé odmocniny jsou diagonálními prvky D 1/2 , aby matice odmocniny byla sama o sobě definitivní, je nutné použít pouze jedinečné kladné odmocniny původních vlastních čísel.

Řešení v uzavřené formě

Pokud je matice idempotentní , což znamená , pak podle definice je jedním z jejích odmocnin samotná matice.

Diagonální a trojúhelníkové matice

Pokud D je diagonální n × n matice , pak některé z jejích odmocnin jsou diagonální matice , kde . V případě, že diagonální prvky D jsou skutečné a non-negativní, pak je pozitivně semidefinitní, a v případě, že druhé odmocniny jsou přijímána s non-záporným znaménkem, výsledná matice je hlavní kořen D . Diagonální matice může mít další ne-diagonální kořeny, pokud jsou některé záznamy na diagonále stejné, jak ukazuje příklad výše uvedené matice identity.

Pokud U je horní trojúhelníková matice (což znamená, že její položky jsou pro ) a nanejvýš jeden z jejích diagonálních záznamů je nula, pak jedno horní trojúhelníkové řešení rovnice lze nalézt následovně. Protože by rovnice měla být splněna, nechť je hlavní odmocnina komplexního čísla . Za předpokladu to zaručuje, že pro všechna i, j (protože hlavní odmocniny komplexních čísel leží na jedné polovině komplexní roviny). Z rovnice

odvodíme, že lze rekurzivně vypočítat pro zvýšení z 1 na n -1 jako:

Pokud U je horní trojúhelníkový, ale má na diagonále více nul, pak druhá odmocnina nemusí existovat, jak ukazuje příklad . Všimněte si, že diagonální položky trojúhelníkové matice jsou přesně její vlastní čísla (viz Vlastnosti trojúhelníkové matice# ).

Diagonalizací

N x n matice je diagonalizable v případě, že je matice, V a diagonální matice D tak, že = VDV -1 . K tomu dochází tehdy a jen tehdy, má -li A n vlastních vektorů, které tvoří základ pro C n . V tomto případě, V může být zvolena tak, aby se matrice s n vektorů jako jsou sloupy, a tak odmocnina je

kde S je jakákoliv odmocnina D . Vskutku,

Matici lze například diagonalizovat jako VDV −1 , kde

a .

D má hlavní odmocninu

,

dávající odmocninu

.

Když je A symetrická, může být diagonalizující matice V vytvořena ortogonální matice vhodnou volbou vlastních vektorů (viz spektrální věta ). Pak inverzní k V je jednoduše transpozice, takže

Schurovým rozkladem

Každá čtvercová matice s komplexní hodnotou , bez ohledu na diagonalizovatelnost, má Schurův rozklad daný tím, kde je horní trojúhelníkový a je unitární (význam ). Na vlastní čísla ze jsou přesně diagonální vstupy z ; pokud je nanejvýš jeden z nich nula, pak následuje odmocnina

kde druhou odmocninu horní trojúhelníkové matice lze nalézt, jak je popsáno výše.

Pokud je kladná určitá, pak vlastní čísla jsou všechny kladné reality, takže zvolená úhlopříčka také sestává z kladných skutečností. Vlastní čísla jsou tedy pozitivní reality, což znamená, že výsledná matice je hlavním kořenem .

Jordánským rozkladem

Podobně jako u Schurova rozkladu lze každou čtvercovou matici rozložit, protože kde P je invertibilní a J je v Jordánově normální formě .

Chcete -li vidět, že jakákoli komplexní matice s pozitivními vlastními čísly má druhou odmocninu stejné formy, stačí to zkontrolovat pro Jordanův blok. Každý takový blok má tvar λ ( I + N ) s λ> 0 a N nilpotentní . Jestliže (1 + z ) 1/2 = 1 + a 1 z + a 2 z 2 + ⋯ je binomická expanze pro druhou odmocninu (platí v | z | <1), pak jako formální mocninová řada se její druhá mocnina rovná 1 + z . Dosazením N za z bude pouze konečný počet členů nenulový a S = √λ ( I + a 1 N + a 2 N 2 + ⋯) dává druhou odmocninu Jordanova bloku s vlastní hodnotou √λ .

Stačí zkontrolovat jedinečnost pro Jordanův blok s λ = 1. Čtverec zkonstruovaný výše má tvar S = I + L, kde L je polynom v N bez konstantního členu. Jakékoliv jiné odmocnina T s pozitivní čísel má tvar T = I + M s M nilpotentní, dojíždění s N a tím i L . Ale pak 0 = S 2 - T 2 = 2 ( L - M ) ( I + ( L + M )/2) . Vzhledem k tomu, L a M dojíždět, matice L + M je nilpotentní a I + ( L + M )/2 je invertibilní s inverzí danou Neumannovou řadou . Proto L = M .

Pokud A je matice s pozitivními vlastními hodnotami a minimálním polynomem p ( t ) , pak Jordanův rozklad na zobecněné vlastní prostory A lze odvodit z částečné frakční expanze p ( t ) −1 . Odpovídající výstupky na všeobecných eigenspaces jsou dány reálné polynomy v A . Na každém vlastním prostoru má A tvar λ ( I + N ), jak je uvedeno výše. Výraz mocninové řady pro odmocninu ve vlastním prostoru ukazuje, že hlavní odmocnina A má tvar q ( A ), kde q ( t ) je polynom se skutečnými koeficienty.

Silová řada

Připomeňme formální výkonové řady , které konvergují za předpokladu (protože koeficienty mocninných řad jsou sčítatelné). Zapojením do tohoto výrazu získáte

za předpokladu, že . Na základě Gelfandova vzorce je tato podmínka ekvivalentní požadavku, aby bylo spektrum obsaženo na disku . Tato metoda definování nebo výpočtu je obzvláště užitečná v případě, kdy je kladná polodefinita. V takovém případě máme a proto , takže výraz definuje druhou odmocninu, z níž se navíc ukáže jedinečný pozitivní semi-určitý kořen. Tato metoda zůstává platná pro definování odmocnin operátorů na nekonečně dimenzionálních Banachových nebo Hilbertových prostorech nebo určitých prvků (C*) Banachových algeber.

Iterační řešení

Iterací Denman – Beavers

Dalším způsobem, jak najít druhou odmocninu n × n matice A, je iterace odmocniny Denman – Beavers.

Nechť Y 0 = A a Z 0 = I , kde I je matice identity n × n . Iterace je definována pomocí

Protože toto používá dvojici sekvencí inverzí matic, jejichž pozdější prvky se mění poměrně málo, pouze první prvky mají vysoké výpočetní náklady, protože zbytek lze vypočítat z dřívějších prvků pouze s několika průchody variantou Newtonovy metody pro výpočet inverzí ,

S tím, pro pozdější hodnoty k jeden nastaví a pak použije pro nějaké malé n (možná jen 1), a podobně pro

Konvergence není zaručena, a to ani pro matice, které mají odmocniny, ale pokud proces konverguje, matice konverguje kvadraticky na druhou odmocninu A 1/2 , zatímco konverguje k její inverzní A −1/2 .

Babylonskou metodou

Ještě další iterační metoda je získána známým vzorcem babylonské metody pro výpočet druhé odmocniny skutečného čísla a jeho aplikací na matice. Nechť X 0 = I , kde I je matice identity . Iterace je definována pomocí

Konvergence opět není zaručena, ale pokud proces konverguje, matice konverguje kvadraticky na druhou odmocninu A 1/2 . Ve srovnání s iterací Denman – Beavers je výhodou babylonské metody, že na jeden iterační krok je třeba vypočítat pouze jednu inverzní matici . Na druhou stranu, protože iterace Denman – Beavers používá dvojici sekvencí inverzí matic, jejichž pozdější prvky se mění poměrně málo, pouze první prvky mají vysoké výpočetní náklady, protože zbytek lze vypočítat z dřívějších prvků pouze několika průchody varianta Newtonovy metody pro výpočet inverzí (viz Denman – Beaversova iterace výše); stejný přístup lze samozřejmě použít k získání jediné sekvence inverzí potřebných pro babylonskou metodu. Na rozdíl od iterace Denman – Beavers je však babylonská metoda numericky nestabilní a je pravděpodobnější, že konvergovat nebude.

Babylonská metoda vyplývá z Newtonovy metody pro rovnici a použití pro všechny

Odmocniny pozitivních operátorů

V lineární algebry a obsluhy teorie , daný ohraničenou pozitivně semidefinitní operátora (nezáporné uživatelů) T na komplexním Hilbert prostoru, B je druhá odmocnina z T -li T = B * B , kde B * označuje sdružený operátor z B . Podle spektrálního teorému je kontinuální funkční počet může být použita k získání operátor T poloviny tak, že T 1/2 je samo o sobě pozitivní a ( T 1/2 ) 2 = T . Operátor T 1/2 je jedinečný nezáporné odmocnina z T .

Ohraničený nezáporný operátor na složitém Hilbertově prostoru se podle definice sám nastavuje. Takže T = ( T 1/2 )* T 1/2 . Naopak triviálně platí, že každý operátor formuláře B* B není záporný. Operátor T proto není záporný právě tehdy, když T = B* B pro některé B (ekvivalentně T = CC* pro některé C ).

Choleského faktorizace poskytuje další konkrétní příklad odmocniny, která by neměla být zaměňována s unikátním nezápornou odmocniny.

Jednotná svoboda odmocnin

Pokud T je nezáporný operátor na Hilbertově prostoru s konečnou dimenzí, pak všechny odmocniny T jsou vztaženy jednotnými transformacemi. Přesněji, pokud T = A*A = B*B , pak existuje unitární U takové, že A = UB .

Ve skutečnosti vezměte B = T 1/2být jedinečný nezáporné odmocnina T . Pokud je T přísně kladné, pak B je invertibilní, a tak U = AB −1 je unitární:

Pokud T je nezáporné, aniž by bylo přísně kladné, pak inverzní B nelze definovat, ale Moore-Penroseův pseudoinverzní B + může být. V tomto případě operátor B + je částečný isometry , to znamená, že jednotný operátor z řady T sám na sebe. To pak může být rozšířena na unitární operátor U na celém prostoru nastavením je rovná totožnosti na jádra T . Obecněji řečeno, je to pravda, na nekonečný trojrozměrný Hilbertova prostoru, pokud je navíc, Tuzavřený rozsah . Obecně platí, že pokud A , B jsou uzavřené a hustě definované operátory na Hilbertově prostoru H a A* A = B* B , pak A = UB, kde U je částečná izometrie.

Některé aplikace

Odmocniny a jednotná svoboda odmocnin mají aplikace v rámci funkční analýzy a lineární algebry.

Polární rozklad

Pokud A je invertibilní operátor na Hilbertově prostoru s konečnou dimenzí, pak existuje jedinečný unitární operátor U a kladný operátor P takový, že

To je polární rozklad A . Kladný operátor P je jedinečná kladná odmocnina kladného operátoru A A a U je definován U = AP −1 .

Pokud A není invertibilní, pak má stále polární kompozici, ve které je P definováno stejným způsobem (a je jedinečné). Unitární operátor U není jedinečný. Spíše je možné určit „přirozeného“ unitárního operátora takto: AP + je unitární operátor z rozsahu A k sobě, který lze rozšířit identitou na jádře A . Výsledný jednotný operátor U se potom získá polární rozklad A .

Operátoři Kraus

Podle Choiho výsledku lineární mapa

je zcela pozitivní právě tehdy, pokud je ve formě

kde knm . Nechť { E pq } ⊂ C n × n je n 2 elementárních maticových jednotek. Pozitivní matice

se nazývá Choiho matice Φ. Provozovatelé Kraus odpovídají, ne nutně čtvercové, čtvercové kořeny M cp : Pro každou druhou odmocninu B z M cp , lze získat rodina provozovatelů Kraus V i uvolněním operace vec pro každý sloupec b i z B . Všechny sady Krausových operátorů jsou tedy propojeny parciálními izometriemi.

Smíšené soubory

V kvantové fyzice je matice hustoty pro n -úrovňový kvantový systém n × n komplexní matice ρ, která je kladným semidefinitem se stopou 1. Pokud ρ lze vyjádřit jako

kde a Σ p i = 1, množina

říká se, že je to soubor, který popisuje smíšený stav ρ . Upozornění { v i } nemusí být ortogonální. Různé soubory popisující stav ρ jsou spojeny unitárními operátory prostřednictvím odmocnin z ρ . Předpokládejme například

Podmínka stopy 1 znamená

Nechat

a v i je normalizované a i . Vidíme to

dává smíšený stav ρ .

Kalmanův filtr bez vůně

V neparfumovaném Kalmanově filtru (UKF) je odmocnina kovarianční matice stavových chyb vyžadována pro neparfumovanou transformaci, což je použitá metoda statistické linearizace. Bylo předloženo srovnání mezi různými metodami výpočtu druhé odmocniny matice v rámci aplikace UKF fúze senzorů GPS/INS, která ukázala, že Choleskyho dekompoziční metoda byla nejvhodnější pro aplikace UKF.

Viz také

Poznámky

  1. ^ a b Higham, Nicholas J. (duben 1986), „Newtonova metoda pro Matrix Square Root“ (PDF) , Mathematics of Computation , 46 (174): 537–549, doi : 10,2307/2007992 , JSTOR  2007992
  2. ^ Mitchell, Douglas W. (listopad 2003). „Použití Pythagorových trojic ke generování odmocnin z “. Matematický věstník . 87 (510): 499–500. doi : 10,1017/s0025557200173723 .
  3. ^ a b c Horn & Johnson (2013) , s. 439, Věta 7.2.6 s
  4. ^ Horn, Roger A .; Johnson, Charles R. (1990). Maticová analýza . Cambridge: Cambridge Univ. Lis. p. 411. ISBN 9780521386326.
  5. ^ Analytické funkce matic viz
  6. ^ Pro holomorfní funkční počet viz:
  7. ^ Deadman, Edvin; Higham, Nicholas J .; Ralha, Rui (2013), „Blocked Schur Algorithms for Computing the Matrix Square Root“ (PDF) , Applied Parallel and Scientific Computing , Springer Berlin Heidelberg, pp. 171–182, doi : 10.1007/978-3-642-36803- 5_12 , ISBN 978-3-642-36802-8
  8. ^ Denman & Beavers 1976 ; Cheng a kol. 2001
  9. ^ Higham, Nicholas J. (1997). „Stabilní iterace pro odmocninu matice“. Numerické algoritmy . 15 (2): 227–242. Bibcode : 1997 NuAlg..15..227H . doi : 10,1023/A: 1019150005407 .
  10. ^ Julier, S .; J. Uhlmann (1997), „Nové rozšíření Kalmanovy filtrace na nelineární systémy“, řada SPIE Proceedings , zpracování signálu, fúze senzorů a rozpoznávání cílů VI, 3068 : 182–193, Bibcode : 1997SPIE.3068..182J , CiteSeerX  10.1.1.5.2891 , doi : 10.1117/12.280797
  11. ^ Rhudy, Matthew; Yu Gu, Jason Gross a Marcello R. Napolitano; Gross, Jason; Napolitano, Marcello R. (prosinec 2011), „Evaluation of Matrix Square Root Operations for UKF within a UAV_Based GPS/INS Sensor Fusion Application“, International Journal of Navigation and Observation , 2011 : 1–11, doi : 10.1155/2011/416828Správa CS1: více jmen: seznam autorů ( odkaz )

Reference