Základ (lineární algebra) - Basis (linear algebra)

Stejný vektor může být zastoupen na dvou různých základnách (fialové a červené šipky).

V matematiky , je množina B vektorů ve vektorovém prostoru V, se nazývá základ , pokud každý prvek V může být napsána jedinečným způsobem jako konečný lineární kombinace prvků B . Koeficienty této lineární kombinace jsou označovány jako komponenty nebo souřadnic vektoru s ohledem na B . Prvky základu se nazývají základní vektory .

Ekvivalentně, sada B je základ, pokud její prvky jsou lineárně nezávislé a každý prvek V je lineární kombinací prvků B . Jinými slovy, základem je lineárně nezávislá množina překlenutí .

Vektorový prostor může mít několik základen; nicméně všechny báze mají stejný počet prvků, nazývaný dimenze vektorového prostoru.

Tento článek se zabývá hlavně vektorovými prostory s konečnou dimenzí. Mnoho principů však platí také pro nekonečně dimenzionální vektorové prostory.

Definice

Základ B na vektorovém prostoru V přes pole F (jako jsou reálná čísla R nebo komplexní čísla C ) je lineárně nezávislé podmnožina z V, která se rozkládá v V . To znamená, že podskupina B z V, je základem, pokud splňuje dvou následujících podmínek:

  • vlastnost lineární nezávislosti :
    Pro každou konečnou podmnožinu z B , je-li pro některé v F , pak ; a
  • klenout vlastnost:
    pro každý vektor v ve V lze vybrat ve F a v B tak, že .

Tyto skaláry se nazývají souřadnice vektoru V s ohledem na základ B , a od první vlastnosti, které jsou jednoznačně určeny.

Vektorový prostor, který má konečný základ, se nazývá konečný-dimenzionální . V tomto případě lze konečnou podmnožinu považovat za B samotnou ke kontrole lineární nezávislosti ve výše uvedené definici.

Často je vhodné nebo dokonce nutné mít uspořádání na základě vektorů, například při diskusi o orientaci , nebo když vezmeme v úvahu skalární koeficienty vektoru s ohledem na základ, aniž bychom výslovně odkazovali na elementy základny. V tomto případě je uspořádání nutné pro přiřazení každého koeficientu k odpovídajícímu základnímu prvku. Toto uspořádání lze provést očíslováním základních prvků. Abychom zdůraznili, že byl vybrán řád, hovoří se o uspořádaném základě , který tedy není pouze nestrukturovanou sadou , ale sekvencí , indexovanou rodinou nebo podobným; viz § Objednané základny a souřadnice níže.

Příklady

Tento obrázek ilustruje standardní základ v R 2 . Modré a oranžové vektory jsou prvky základu; zelený vektor lze vyjádřit pomocí základních vektorů, a proto je na nich lineárně závislý .
  • Sada R 2 z uspořádaných dvojic z reálných čísel je vektorový prostor pro následující vlastnosti:
    komponentní přidání
    a skalární násobení
    kde je nějaké skutečné číslo. Jednoduchý Základem tohoto vektorového prostoru, nazývané standardní základ se skládá ze dvou vektorů e 1 = (1,0) a e 2 = (0,1) , protože, jakýkoliv vektor, V = ( , b ) z R 2 mohou být být jedinečně zapsán jako
    Jakékoliv jiné dvojice lineárně nezávislých vektorů R 2 , jako je (1, 1) a (-1, 2) , formy také základ R 2 .
  • Obecněji, v případě, F je pole , soubor z n -tuples prvků F je vektorový prostor pro podobně definované sčítání a skalární násobení. Nechat
    je n -tuple se všechny složky se rovnají 0, s výjimkou i th, která je 1. Pak je báze , která se nazývá
    standardně z
  • Jestliže F je pole, tím polynom kroužek F [ X ] o polynomů v jednom Neurčitý je F -vector prostor, a má plošnou B , nazvaný monomial základ , skládající se ze všech monomials :
    Základem je také jakákoli sada polynomů, která obsahuje přesně jeden polynom každého stupně. Taková sada polynomů se nazývá polynomiální sekvence . Příklady (mezi mnoha) takových polynomických sekvencí jsou Bernsteinovy ​​polynomy a Chebyshevovy polynomy .

Vlastnosti

Mnoho vlastností konečných bází vyplývá z výměnné lemma Steinitz , který uvádí, že pro jakýkoli vektorovém prostoru V , dané konečné trvající sady S a lineárně nezávislé nastavení L a n prvků V , může se nahradit n dobře zvolené prvky S o prvky L získat spanning sadu obsahující L , která má své dalších prvků v s , a které mají stejný počet prvků, jako je s .

Většina vlastností vyplývajících z Steinitzova výměnného lemmatu zůstává pravdivá, když neexistuje žádná konečná množina rozpětí, ale jejich důkazy v nekonečném případě obecně vyžadují zvolený axiom nebo jeho slabší formu, jako je ultrafiltrové lemma .

Pokud V je vektorový prostor nad polem F , pak:

  • Jestliže L je lineárně nezávislá podmnožina rozpětí množiny SV , pak existuje základ B takový, že
  • V má základ (toto je předchozí vlastnost, kde L je prázdná množina a S = V ).
  • Všechny základy V mají stejnou mohutnost , která se nazývá dimenze ve V. . Toto je věta o dimenzi .
  • Sada generující S je základem V případě, a pouze v případě, že je minimální, to znamená, že žádná vlastní podmnožina z S je také generující sadu V .
  • Lineárně nezávislá množina L je základem tehdy a jen tehdy, je -li maximální, to znamená, že není vlastní podmnožinou žádné lineárně nezávislé sady.

Pokud V je vektorový prostor dimenze n , pak:

  • Podskupina V s n prvky je základem právě tehdy, je -li lineárně nezávislá.
  • Podskupina V s n prvků je základem tehdy a jen tehdy, je-li klenout sada V .

Souřadnice

Nechť V je vektorový prostor konečné dimenze n nad polem F a

být základem V . Podle definice základu může být každé v ve V zapsáno jedinečným způsobem jako

kde koeficienty jsou skalární (to znamená, že prvky F ), které se nazývají souřadnice z V průběhu B . Pokud však hovoříme o sadě koeficientů, ztratíme korespondenci mezi koeficienty a základními prvky a několik vektorů může mít stejnou sadu koeficientů. Například, a mají stejnou sadu koeficientů {2, 3} a jsou různé. Často je proto vhodné pracovat s uspořádaným základem ; to se obvykle provádí indexováním základních prvků podle prvních přirozených čísel. Potom souřadnice vektoru tvoří sekvenci podobně indexovanou a vektor je zcela charakterizován sekvencí souřadnic. Řazený základ se také nazývá rámec , slovo běžně používané v různých kontextech pro odkazování na sekvenci dat umožňující definovat souřadnice.

Nechť, jako obvykle, je množina z n -tuples prvků ze F . Tato sada je F -vektorový prostor s přidáním a skalárním násobením definovaným po komponentách. Mapa

je lineární izomorfismus z vektorového prostoru na V . Jinými slovy, je koordinovat prostor z V a n -tuple je koordinovat vektor z V .

Inverzní obraz o o je n -tuple všechny, jejichž součásti jsou 0, kromě toho, že i té, která je 1. vzniku uspořádaného základ , který se nazývá jeho standardní základ nebo kanonický základ . Uspořádaný základ B je obrazem kanonického základu .

Z toho, co předchází, že každý objednaný Základem je obraz pomocí lineárního izomorfismu kanonického základě , a že každý lineární izomorfismus od do V, může být definována jako izomorfismus, která mapuje kanonický základ na danou objednanou bázi V . Jinými slovy, je ekvivalentní k definování uspořádané základ V , nebo lineární izomorfismus z na V .

Změna základu

Nechť V být vektorový prostor dimenze n přes pole F . Vzhledem k tomu, dva (objednávku) základny a z V , je často užitečné vyjádřit souřadnic vektoru x s ohledem na pokud jde o souřadnic s ohledem na to může být provedeno pomocí změny-of-základě vzorce , který je popsán níže . Dolní indexy „starý“ a „nový“ byly vybrány, protože je obvyklé odkazovat na a jako na starý základ a nový základ . Je užitečné popsat staré souřadnice pomocí nových, protože obecně má člověk výrazy zahrnující staré souřadnice a pokud chce získat ekvivalentní výrazy, pokud jde o nové souřadnice; toho se dosáhne nahrazením starých souřadnic jejich výrazy ve smyslu nových souřadnic.

Nové základní vektory jsou obvykle dány jejich souřadnicemi na starém základě, tj.

Pokud a jsou souřadnice vektoru x nad starým a novým základem, vzorec pro změnu základu je

pro i = 1,…, n .

Tento vzorec může být stručně napsán v maticovém zápisu. Nechť A je matice , a

být sloupcové vektory souřadnic V, ve staré a nové báze v tomto pořadí, pak je vzorec pro změnu souřadnic je

Vzorec lze dokázat zvážením rozkladu vektoru x na dvou základnách: jedna má

a

Vzorec pro změnu základu pak vyplývá z jedinečnosti rozkladu vektoru na základě zde ; to je

pro i = 1,…, n .

Související pojmy

Modul zdarma

Pokud někdo nahradí pole vyskytující se v definici vektorového prostoru prstenem , získá definici modulu . U modulů je lineární nezávislost a rozpětí množin definováno přesně jako u vektorových prostorů, ačkoli „ generující množina “ se používá častěji než u „překlenovací sady“.

Stejně jako pro vektorové prostory je základem modulu lineárně nezávislá podmnožina, která je také generující sadou. Zásadní rozdíl oproti teorii vektorových prostorů spočívá v tom, že ne každý modul má základ. Modul, který má základ, se nazývá bezplatný modul . Volné moduly hrají zásadní roli v teorii modulů, protože je lze použít k popisu struktury nesvobodných modulů prostřednictvím volných rozlišení .

Modul přes celá čísla je přesně to samé jako abelianská skupina . Volný modul přes celá čísla je tedy také volnou abelianskou skupinou. Volné abelianské skupiny mají specifické vlastnosti, které nejsou sdíleny moduly přes jiné prstence. Konkrétně, každá podskupina volné abelian skupiny je volný abelian skupina, a, pokud G je podskupina konečně vytvořeného volného abelian skupiny H (tj abelian skupina, která má konečnou základ), je základem z H a celé číslo 0 ≤ kn takové, že je základem G , u některých nenulových celých čísel . Podrobnosti viz Volná abelianská skupina § Podskupiny .

Analýza

V kontextu nekonečně dimenzionálních vektorových prostorů nad skutečnými nebo komplexními čísly termín Hamelský základ (pojmenovaný poGeorgu Hamelovi) neboalgebraický základlze použít k označení základu definovaného v tomto článku. To je třeba odlišit od ostatních pojmů „základu“, které existují, když jsou nekonečně dimenzionální vektorové prostory vybaveny zvláštní strukturou. Nejdůležitějšími alternativami jsouortogonální bázenaHilbertově prostoru,Schauderovy bázeaMarkushevichovy bázenanormovaných lineárních prostorech. V případě reálných číselRviděných jako vektorový prostor nad polemQracionálních čísel jsou Hamelské báze nepočítatelné a mají konkrétněmohutnostkontinua, což jekardinální číslo ,kdeje nejmenší nekonečný kardinál, kardinál celých čísel.

Společným rysem ostatních pojmů je, že umožňují vytváření nekonečných lineárních kombinací základních vektorů za účelem generování prostoru. To samozřejmě vyžaduje, aby v těchto prostorech bylo smysluplně definováno nekonečné množství, jako je tomu v případě topologických vektorových prostorů - velké třídy vektorových prostorů zahrnujících např. Hilbertovy , Banachovy nebo Fréchetovy prostory .

Upřednostňování jiných typů základen pro nekonečně dimenzionální prostory je odůvodněno skutečností, že Hamelův základ se v Banachových prostorech stává „příliš velkým“: Pokud X je nekonečně dimenzionální normovaný vektorový prostor, který je úplný (tj. X je Banachův prostor ), pak jakýkoli hamelský základ X je nutně nepočitatelný . To je důsledek věty o kategorii Baire . Úplnost a také nekonečná dimenze jsou zásadními předpoklady v předchozím nároku. Prostory konečných dimenzí mají podle definice konečné základy a existují nekonečno-dimenzionální ( neúplné ) normované prostory, které mají spočitatelné základny Hamel. Vezměme si , prostor ze sekvencí reálných čísel, které mají pouze konečně mnoho nenulové prvky s normou . Jeho standardní základ , skládající se ze sekvencí majících pouze jeden nenulový prvek, který se rovná 1, je spočitatelný Hamelský základ.

Příklad

Při studiu Fourierových řad se člověk dozví, že funkce {1} ∪ {sin ( nx ), cos ( nx ): n = 1, 2, 3, ...} jsou „ortogonálním základem“ (skutečného nebo komplexního) vektorový prostor všech (reálných nebo komplexních) funkcí na intervalu [0, 2π], které jsou v tomto intervalu integrovatelné do čtverců, tj. funkce f splňující

Funkce {1} ∪ {sin ( nx ), cos ( nx ): n = 1, 2, 3, ...} jsou lineárně nezávislé a každá funkce f, která je na [0, 2π] integrovatelná do čtverců, je "nekonečná" jejich lineární kombinace, ve smyslu, že

pro vhodné (skutečné nebo komplexní) koeficienty a k , b k . Mnoho funkcí integrovatelných do čtverce však nelze reprezentovat jako konečné lineární kombinace těchto základních funkcí, které proto neobsahují hamelský základ. Každý hamelský základ tohoto prostoru je mnohem větší než tento pouze spočítatelný nekonečný soubor funkcí. Hamelské základy prostorů tohoto druhu obvykle nejsou užitečné, zatímco ortonormální základy těchto prostorů jsou ve Fourierově analýze zásadní .

Geometrie

Geometrické pojmy afinního prostoru , projektivního prostoru , konvexní množiny a kužele mají související pojmy základ . Afinní základ pro n rozměrné afinního prostoru je bodů lineárního poloze . Aprojektivním základem jsoubody v obecné poloze, v projektivním prostoru dimenzen. Akonvexní základna zmnohostěnuje množina vrcholů jehokonvexní trupu. Akuželový základ tvoří jeden bod za hranou polygonálního kužele. Viz takéHilbertův základ (lineární programování).

Náhodný základ

Pro rozdělení pravděpodobnosti v R n s funkcí hustoty pravděpodobnosti , jako je ekvidistribuce v n -dimenzionální kouli s ohledem na Lebesgueovu míru, lze ukázat, že n náhodně a nezávisle vybraných vektorů bude tvořit základ s pravděpodobností jedna , která je vzhledem k tomu, že n lineárně závislých vektorů x 1 ,…, x n v R n by mělo splňovat rovnici det [ x 1x n ] = 0 (nulový determinant matice se sloupci x i ) a množinu nul netriviálního polynomu má nulovou míru. Toto pozorování vedlo k technikám aproximace náhodných základen.

Empirická distribuce délek N párových téměř ortogonálních řetězců vektorů, které jsou nezávisle náhodně vzorkovány z n -dimenzionální krychle [−1, 1] n jako funkce dimenze, n . Boxplots ukazují druhý a třetí kvartil těchto dat pro každé n , červené pruhy odpovídají mediánům a modré hvězdy označují prostředky. Červená křivka ukazuje teoretickou mez danou ekv. (1) a zelená křivka ukazuje upřesněný odhad.

Je obtížné numericky zkontrolovat lineární závislost nebo přesnou ortogonalitu. Proto se používá pojem e-ortogonality. Pro prostory s vnitřním součinem je x ε-ortogonální k y, pokud (tj. Kosinus úhlu mezi x a y je menší než ε ).

Ve vysokých dimenzích jsou dva nezávislé náhodné vektory s vysokou pravděpodobností téměř ortogonální a počet nezávislých náhodných vektorů, které jsou všechny s danou vysokou pravděpodobností párově téměř ortogonální, exponenciálně roste s dimenzí. Přesněji zvažte ekvidistribuci v n -dimenzionální kouli. Vyberte N nezávislých náhodných vektorů z koule (jsou nezávislé a identicky rozmístěné ). Nechť θ je malé kladné číslo. Pak pro

 

 

 

 

(Rovnice 1)

N náhodných vektorů je všech párů e-ortogonálních s pravděpodobností 1- θ . Tento N roste exponenciálně s dimenzí n a dostatečně velkým n . Tato vlastnost náhodných bází je projevem takzvaného jevu koncentrace koncentrace .

Obrázek (vpravo) ukazuje rozložení délek N párových téměř ortogonálních řetězců vektorů, které jsou nezávisle náhodně vzorkovány z n -dimenzionální krychle [−1, 1] n jako funkce dimenze, n . V kostce je nejprve náhodně vybrán bod. Druhý bod je náhodně vybrán ve stejné krychli. Pokud byl úhel mezi vektory v rozmezí π/2 ± 0,037π/2, pak byl vektor zachován. V dalším kroku se ve stejné hyperkrychli vygeneruje nový vektor a vyhodnotí se jeho úhly s dříve generovanými vektory. Pokud jsou tyto úhly v rozmezí π/2 ± 0,037π/2, pak je vektor zachován. Proces se opakuje, dokud se řetěz téměř ortogonality nerozbije, a zaznamená se počet takových párových téměř ortogonálních vektorů (délka řetězce). Pro každé n bylo pro každou dimenzi numericky konstruováno 20 párových téměř ortogonálních řetězců. Je prezentováno rozdělení délky těchto řetězců.

Důkaz, že každý vektorový prostor má svůj základ

Nechť V být jakýkoli vektorový prostor přes některé oblasti F . Nechť X je množina všech lineárně nezávislých podmnožin V. .

Množina X je neprázdná, protože prázdná množina je nezávislou podmnožinou V a je částečně uspořádána zahrnutím, které je jako obvykle označeno .

Nechť Y je podmnožinou X, která je zcela uspořádána pomocí , a nechť L Y je sjednocením všech prvků Y (což jsou samy o sobě určité podmnožiny V ).

Protože ( Y , ⊆) je zcela uspořádané, každá konečná podmnožina L Y je podmnožinou prvku Y , což je lineárně nezávislá podmnožina V , a tudíž L Y je lineárně nezávislá. Tak L Y je prvek X . Z tohoto důvodu, L Y je horní mez pro Y v ( X , ⊆): je to prvek X , která obsahuje každý prvek Y .

Protože X je neprázdné a každá zcela uspořádaná podmnožina ( X , ⊆) má v X horní hranici , Zornovo lemma tvrdí, že X má maximální prvek. Jinými slovy, existuje nějaký prvek L max z X splňující podmínku, že kdykoli L max ⊆ L pro nějaký prvek L z X , pak L = L max .

Zbývá dokázat, že L max je základem V . Vzhledem k tomu, L max patří k X , již víme, že L max je lineárně nezávislé podmnožina V .

Pokud by se některý vektor w z V, který není v rozpětí L max , pak w nebude prvek L max obou. Nechť L w = L max ∪ { w }. Tato sada je prvkem X , to znamená, že je to lineárně nezávislá podmnožina V (protože w není v rozsahu L max a L max je nezávislá). Protože L max ⊆ L w a L max ≠ L w (protože L w obsahuje vektor w, který není obsažen v L max ), je to v rozporu s maximálností L max . Tak to ukazuje, že L se max klene V .

Proto L max je lineárně nezávislé a rozpětí V . Je to tedy základ V , a to dokazuje, že každý vektorový prostor má základ.

Tento důkaz se opírá o Zornovo lemma, které je ekvivalentní zvolenému axiomu . A naopak bylo dokázáno, že pokud má každý vektorový prostor základ, pak platí axiom volby. Obě tvrzení jsou tedy ekvivalentní.

Viz také

Poznámky

Reference

Obecné reference

Historické reference

externí odkazy