Vlastní složení matice - Eigendecomposition of a matrix

V lineární algebře , eigendecomposition je faktorizace z matrice do kanonický tvar , přičemž matrice je znázorněno na podmínkách jeho vlastních čísel a vektorů . Tímto způsobem lze faktorizovat pouze diagonalizovatelné matice . Když je faktorizovaná matice normální nebo skutečná symetrická matice , rozklad se nazývá „spektrální rozklad“, odvozený ze spektrální věty .

Základní teorie maticových vlastních vektorů a vlastních čísel

A (nenulový) vektor v dimenze N je vlastní vektor čtverce N × N matice A, pokud splňuje lineární rovnici tvaru

pro některé skalární λ . Pak se λ nazývá vlastní hodnota odpovídající v . Geometricky řečeno, vlastní vektory A jsou vektory, které A pouze prodlužují nebo zmenšují, a množství, o které se prodlužují/zmenšují, je vlastní hodnota. Výše uvedená rovnice se nazývá rovnice vlastních čísel nebo problém vlastních čísel.

Tím se získá rovnice vlastních čísel

Říkáme p ( Á ) je charakteristický polynom , a rovnice, nazvaný charakteristická rovnice, je N tého řádu polynomická rovnice v neznámém lambda . Tato rovnice bude mít N' lambda odlišné řešení, kde 1 ≤ N ÁN . Množina řešení, to znamená, že vlastní hodnoty, se nazývá spektrum z A .

Pokud je pole skalárů algebraicky uzavřeno , pak můžeme faktor p jako

Celé číslo n i se nazývá algebraická multiplicita vlastní hodnoty λ i . Součet algebraických multiplicit je N ::

Pro každé vlastní číslo λ i máme konkrétní rovnici vlastních čísel

Ke každé rovnici vlastních čísel bude existovat 1 ≤ m in i lineárně nezávislých řešení. Lineární kombinace řešení m i (kromě té, která dává nulový vektor) jsou vlastní vektory spojené s vlastní hodnotou λ i . Celé číslo m i je označována jako geometrické multiplicity z λ i . Je důležité mít na paměti, že algebraická multiplicita n i a geometrická multiplicita m i může, ale nemusí být stejná, ale vždy máme m in i . Nejjednodušší případ je samozřejmě tehdy, když m i = n i = 1 . Celkový počet lineárně nezávislých vlastních vektorů, N v , lze vypočítat součtem geometrických multiplicit

Vlastní vektory lze indexovat pomocí vlastních hodnot pomocí dvojitého indexu, přičemž v ij je j . Vlastní vektor pro i th vlastní číslo. Vlastní vektory lze také indexovat pomocí jednoduššího zápisu jednoho indexu v k , přičemž k = 1, 2, ..., N v .

Vlastní složení matice

Nechť A je čtverec n × n matice s n lineárně nezávislými vlastními vektory q i (kde i = 1, ..., n ). Potom A lze rozložit na

kde Q je čtverec n x n matice jehož i tý sloupec je vlastní vektor q i z A , a Λ je diagonální matice , jejíž diagonální prvky jsou odpovídající vlastní čísla, Λ ii = λ i . Tímto způsobem lze faktorizovat pouze diagonalizovatelné matice . Například vadnou matici (což je smyková matice ) nelze diagonalizovat.

N vektory q i jsou zpravidla normalizovány, ale nemusí být. Jako sloupce Q lze také použít nenormalizovanou sadu n vlastních vektorů, v i . To lze pochopit poznámkou, že velikost vlastních vektorů v Q se při rozkladu zruší přítomností Q −1 .

Rozklad lze odvodit ze základní vlastnosti vlastních vektorů:

Příklad

Skutečná matice A 2 × 2

mohou být rozloženy na diagonální matici vynásobením nesingulární matice B

Pak

pro nějakou skutečnou diagonální matici .

Násobení obou stran rovnice vlevo B :

Výše uvedenou rovnici lze rozložit na dvě souběžné rovnice :

Vyčíslení vlastních čísel x a y :

Nájem

to nám dává dvě vektorové rovnice:

A může být reprezentován jedinou vektorovou rovnicí zahrnující dvě řešení jako vlastní čísla:

kde λ představuje dvě vlastní čísla x a y , a u představuje vektory a a b .

Posunutí λ u na levou stranu a vyřazení u ven

Protože B není singulární, je nezbytné, aby u bylo nenulové. Proto,

Tím pádem

což nám dává řešení vlastních čísel pro matici A jako λ = 1 nebo λ = 3 , a výsledná diagonální matice z vlastní kompozice A je tedy .

Uvedení řešení zpět do výše uvedených simultánních rovnic

Řešením rovnic máme

Matice B potřebná pro vlastní složení A tedy je

to je:

Matice inverzní prostřednictvím vlastní kompozice

Pokud lze matici A skládat z vlastních čísel a pokud žádná z jejích vlastních hodnot není nulová, pak je A invertibilní a její inverze je dána vztahem

Pokud je symetrická matice, protože je vytvořena z charakteristických vektorů je zaručeno, že je ortogonální matice , tedy . Kromě toho, protože Λ je diagonální matice , lze její inverzní hodnotu snadno vypočítat:

Praktické implikace

Při eigendecomposition se používá na matrici naměřených, reálných dat je inverzní může mít menší hodnotu, když jsou všechny vlastní čísla používají v nezměněné formě výše. Důvodem je, že jak se vlastní čísla stávají relativně malými, jejich příspěvek k inverzi je velký. Ti, kteří se blíží nule nebo mají „hluk“ měřicího systému, budou mít nepřiměřený vliv a mohou narušit řešení (detekci) pomocí inverze.

Byly navrženy dvě zmírnění: zkrácení malých nebo nulových vlastních čísel a rozšíření nejnižší spolehlivé vlastní hodnoty na hodnoty pod ní.

První metoda zmírnění je podobná řídkému vzorku původní matice a odstraňuje součásti, které nejsou považovány za cenné. Pokud se však roztok nebo proces detekce blíží hladině hluku, může zkrácení odstranit součásti, které ovlivňují požadované řešení.

Druhé zmírnění prodlužuje vlastní hodnotu, takže nižší hodnoty mají mnohem menší vliv na inverzi, ale stále přispívají, takže řešení v blízkosti hluku se stále najdou.

Spolehlivé vlastní číslo lze nalézt za předpokladu, že vlastní hodnoty extrémně podobných a nízkých hodnot jsou dobrou reprezentací hluku měření (který se u většiny systémů předpokládá jako nízký).

Pokud jsou vlastní čísla seřazeny podle hodnoty, pak spolehlivá vlastní čísla lze nalézt minimalizací Laplacianu seřazených vlastních čísel:

kde vlastní čísla jsou upsána s s označující třídění. Pozice minimalizace je nejnižší spolehlivá vlastní hodnota. V měřicích systémech je odmocninou této spolehlivé vlastní hodnoty průměrný šum nad součástmi systému.

Funkční počet

Eigendecomposition umožňuje mnohem snazší výpočet výkonových řad matic. Je -li f  ( x ) dáno vztahem

pak to víme

Protože Λ je diagonální matice , funkce Λ lze velmi snadno vypočítat:

Off-diagonální prvky f  ( Λ ) jsou nulové; to znamená, že f  ( Λ ) je také diagonální matice. Proto se výpočet f  ( A ) redukuje na pouhý výpočet funkce na každém z vlastních čísel.

Podobná technika funguje obecněji s holomorfním funkčním kalkulem , pomocí

od shora . Opět to zjišťujeme

Příklady

což jsou příklady funkcí . Dále je matice exponenciální .

Rozklad pro speciální matrice

Když A je normální nebo skutečná symetrická matice , rozklad se nazývá „spektrální rozklad“, odvozený ze spektrální věty .

Normální matice

Komplexní čtvercová matice A je normální (což znamená A * A = AA * , kde A * je konjugovaná transpozice ) právě tehdy, když ji lze rozložit jako

kde U je unitární matice (což znamená U * = U −1 ) a Λ = diag ( λ 1 , ..., λ n ) je diagonální matice . Sloupce u 1 , ..., u n z U tvoří ortonormální základ a jsou vlastními vektory A s odpovídajícími vlastními hodnotami λ 1 , ..., λ n .

Pokud je A omezeno na hermitovskou matici ( A = A * ), pak Λ má pouze skutečné hodnoty. Pokud je A omezeno na unitární matici, pak Λ vezme všechny své hodnoty na komplexní jednotkový kruh, tj. | λ i | = 1 .

Skutečné symetrické matice

Jako zvláštní případ platí, že pro každou n × n skutečnou symetrickou matici jsou vlastní čísla reálná a vlastní vektory lze vybrat skutečná a ortonormální . Skutečnou symetrickou matici A lze tedy rozložit jako

kde Q je ortogonální matice , jejíž sloupce jsou (výše vybrán, reálné a ortonormální) vlastní vektory A , a Λ je diagonální matice, jejíž vstupy jsou vlastní hodnoty A .

Užitečná fakta

Užitečná fakta týkající se vlastních čísel

  • Produkt z vlastních hodnot se rovná determinant z A
    Všimněte si, že každé vlastní číslo je zvýšeno na moc n i , algebraickou multiplicitu .
  • Součet čísel se rovná stopy z A
    Všimněte si, že každé vlastní číslo je vynásobeno n i , algebraickou multiplicitou .
  • V případě, že vlastní hodnoty A jsou λ i a je invertible, potom vlastní hodnoty A -1 jsou prostě λ−1
    i
    .
  • V případě, že vlastní hodnoty A jsou λ i , pak vlastní hodnoty f  ( A ), jsou prostě f  ( λ i ) , pro jakékoliv funkce holomorphic f .

Užitečná fakta týkající se vlastních vektorů

  • Pokud je Hermitian a plný-pozice, základem vektorů může být zvolena tak, aby vzájemně ortogonální . Vlastní čísla jsou skutečná.
  • Vlastní vektory A -1 jsou stejné jako vektorů A .
  • Vlastní vektory jsou definovány pouze do multiplikativní konstanty. To znamená, že pokud Av = λ v, pak c v je také vlastní vektor pro jakékoli skalární c ≠ 0 . Zejména - v a e v (pro jakékoli θ ) jsou také vlastní vektory.
  • V případě degenerovaných vlastních čísel (vlastní číslo objevující se více než jednou) mají vlastní vektorová navíc volnost otáčení, tj. Jakákoli lineární (ortonormální) kombinace vlastních vektorů sdílejících vlastní čísla (v degenerovaném podprostoru), jsou vlastní vektorová ( v podprostoru).

Užitečné skutečnosti týkající se vlastní kompozice

  • A může být eigendecomposed právě tehdy, když se počet lineárně nezávislých vlastních vektorů, N v , rovná dimenzi vlastního vektoru: N v = N
  • Je -li pole skalárů algebraicky uzavřeno a pokud p ( λ ) nemá opakované kořeny, to znamená, že pak lze A eigendecomposed.
  • Příkaz „ lze eigendecomposed“ však nebude znamenat, že má inverzi.
  • Příkaz „ má inverzní“ však nebude znamenat, že lze eigendecomposed. Protipříkladem je nevratná vadná matice .

Užitečná fakta týkající se inverzní matice

  • A lze invertovat právě tehdy, pokud jsou všechna vlastní čísla nenulová:
  • Pokud λ i ≠ 0 a N v = N , inverzní je dána vztahem

Numerické výpočty

Numerický výpočet vlastních čísel

Předpokládejme, že chceme vypočítat vlastní čísla dané matice. Pokud je matice malá, můžeme je vypočítat symbolicky pomocí charakteristického polynomu . U větších matic je to však často nemožné, v takovém případě musíme použít numerickou metodu .

V praxi se vlastní čísla velkých matic nepočítají pomocí charakteristického polynomu. Výpočet polynomu se stává sám o sobě nákladným a přesné (symbolické) kořeny polynomu vysokého stupně lze obtížně vypočítat a vyjádřit: Abel-Ruffiniho věta naznačuje, že kořeny polynomů vysokého stupně (5 a výše) obecně nemohou vyjádřit jednoduše pomocí n -tých kořenů. Obecné algoritmy pro hledání vlastních vektorů a vlastních čísel jsou proto iterativní .

Existují iterační numerické algoritmy pro sbližování kořenů polynomů, jako je Newtonova metoda , ale obecně je nepraktické vypočítat charakteristický polynom a poté tyto metody použít. Jedním z důvodů je, že malé chyby zaokrouhlení v koeficientech charakteristického polynomu mohou vést k velkým chybám vlastních čísel a vlastních vektorů: kořeny jsou extrémně špatně podmíněnou funkcí koeficientů.

Jednoduchou a přesnou iterační metodou je metoda napájení : je vybrán náhodný vektor v a sekvence jednotkových vektorů se vypočítá jako

Tato sekvence bude téměř vždy konvergovat k vlastnímu vektoru, který odpovídá vlastní hodnotě největší velikosti, za předpokladu, že v má nenulovou složku tohoto vlastního vektoru na základě vlastních vektorů (a také za předpokladu, že existuje pouze jedna vlastní hodnota největší velikosti). Tento jednoduchý algoritmus je užitečný v některých praktických aplikacích; Google jej například používá k výpočtu pořadí stránek dokumentů ve svém vyhledávači. Metoda napájení je také výchozím bodem pro mnoho sofistikovanějších algoritmů. Například tím, že drží nejen poslední vektor v pořadí, ale při pohledu na rozpětí ze všech vektorů v sekvenci, jeden může dostat lepší (rychlejší konvergující) aproximaci pro eigenvector, a tato myšlenka je základem Arnoldi iterace . Alternativně je důležitý QR algoritmus také založen na jemné transformaci výkonové metody.

Numerické výpočty vlastních vektorů

Jakmile jsou vypočítána vlastní čísla, vlastní vektory lze vypočítat řešením rovnice

pomocí Gaussovy eliminace nebo jakékoli jiné metody pro řešení maticových rovnic .

V praktických rozsáhlých metodách vlastních čísel se však vlastní čísla obvykle počítají jinými způsoby, jako vedlejší produkt výpočtu vlastních čísel. Například v energetické iteraci je vlastní vektor skutečně počítán před vlastní hodnotou (která je obvykle počítána Rayleighovým kvocientem vlastního vektoru). V algoritmu QR pro hermitovskou matici (nebo jakoukoli normální matici ) jsou ortonormální vlastní vektory získány jako součin Q matic z kroků v algoritmu. (U obecnějších matic poskytuje QR algoritmus nejprve Schurův rozklad , ze kterého lze vlastní vektory získat postupem zpětné substituce .) U hermitických matic je algoritmus rozdělování a dobývání vlastních čísel účinnější než algoritmus QR, pokud oba vlastní čísla a vlastní čísla jsou žádoucí.

Další témata

Zobecněné vlastní prostory

Připomeňme, že geometrický multiplicity vlastní číslo může být popsán jako rozměr přidruženého eigenspace, na nullspace z lambda I - A . Algebraickou multiplicitu lze také považovat za dimenzi: je to dimenze souvisejícího generalizovaného vlastního prostoru (1. smysl), což je nulový prostor matice ( λ I - A ) k pro jakékoli dostatečně velké k . To znamená, že je to prostor zobecněných vlastních vektorů (první smysl), kde zobecněným vlastním vektorem je jakýkoli vektor, který se nakonec stane 0, pokud je na něj aplikováno λ I - A dostatečně často za sebou. Jakýkoli vlastní vektor je zobecněný vlastní vektor, a proto je každý vlastní prostor obsažen v přidruženém zobecněném vlastním prostoru. To poskytuje snadný důkaz, že geometrická multiplicita je vždy menší nebo rovna algebraické multiplicitě.

Toto použití by nemělo být zaměňováno s obecným problémem vlastní hodnoty popsaným níže.

Konjugovaný vlastní vektor

Konjugát vlastní vektor nebo coneigenvector je vektor odeslána po transformaci na skalární násobek jejího konjugátu, kde je skalární nazývá konjugát vlastní číslo nebo coneigenvalue lineární transformace. Tyto coneigenvectors a coneigenvalues ​​představují v podstatě stejnou informaci a význam jako běžné vlastní vektory a vlastní hodnoty, ale vznikají při použití alternativního souřadnicového systému. Odpovídající rovnice je

Například v teorii koherentního elektromagnetického rozptylu lineární transformace A představuje akci prováděnou rozptylovým objektem a vlastní vektory představují polarizační stavy elektromagnetické vlny. V optice je souřadnicový systém definován z hlediska vlny, známého jako Forward Scattering Alignment (FSA), a dává vzniknout pravidelné rovnici vlastních čísel, zatímco v radaru je souřadnicový systém definován z pohledu radaru, známého jako Zpět Scattering Alignment (BSA), a dává vzniknout rovnici coneigenvalue.

Zobecněný problém s vlastní hodnotou

Generalizovaná problému vlastní (druhý smysl) je problém nalezení vektoru V , že se řídí

kde A a B jsou matice. Pokud proti řídí tato rovnice, s určitou Á , pak nazýváme v zobecněný vlastní vektor z A a B (v druhém smyslu), a λ se nazývá zobecněný vlastní číslo z A a B (v druhém smyslu), což odpovídá zobecněný vlastní vektor v . Možné hodnoty λ se musí řídit následující rovnicí

Pokud lze najít n lineárně nezávislých vektorů { v 1 ,…, v n } , tak, že pro každé i ∈ {1,…, n } , Av i = λ i Bv i , pak definujeme matice P a D tak, že

Pak platí následující rovnost

A důkazem je

A protože P je invertibilní, vynásobíme rovnici zprava její inverzí a dokončíme důkaz.

Množina matic tvaru A - λ B , kde λ je komplexní číslo, se nazývá tužka ; termín maticová tužka může také odkazovat na dvojici ( A , B ) matic.

Pokud je B invertibilní, pak lze původní problém zapsat do formuláře

což je standardní problém vlastní hodnoty. Ve většině situací je však vhodnější neprovádět inverzi, ale spíše vyřešit obecný problém vlastní hodnoty, jak bylo uvedeno původně. To je zvláště důležité, pokud A a B jsou hermitovské matice , protože v tomto případě B −1 A není obecně hermitovská a důležité vlastnosti řešení již nejsou zřejmé.

Pokud jsou A i B symetrické nebo hermitovské a B je také matice s jednoznačnou definicí , vlastní čísla λ i jsou skutečná a vlastní vektory v 1 a v 2 s odlišnými vlastními hodnotami jsou B -ortogonální ( v 1 * Bv 2 = 0 ). V tomto případě mohou být vlastní vektory zvoleny tak, aby výše definovaná matice P splňovala

nebo ,

a existuje základ zobecněných vlastních vektorů (nejedná se o závadný problém). Tento případ se někdy nazývá hermitovská určitá tužka nebo určitá tužka .

Viz také

Poznámky

Reference

externí odkazy