Fylogenetický strom - Phylogenetic tree

Bacteria Archaea Eucaryota Aquifex Thermotoga Cytophaga Bacteroides Bacteroides-Cytophaga Planctomyces Cyanobacteria Proteobacteria Spirochetes Gram-positive bacteria Green filantous bacteria Pyrodicticum Thermoproteus Thermococcus celer Methanococcus Methanobacterium Methanosarcina Halophiles Entamoebae Slime mold Animal Fungus Plant Ciliate Flagellate Trichomonad Microsporidia Diplomonad
Fylogenetický strom založený na genech rRNA , který ukazuje tři životní domény : bakterie , archea a eukaryota . Černá větev ve spodní části fylogenetického stromu spojuje tři větve živých organismů s posledním univerzálním společným předkem . Při absenci outgroup je kořen spekulativní.
Vysoce vyřešený, automaticky generovaný strom života , založený na kompletně sekvenovaných genomech.

Fylogenetický strom (také fylogenetické nebo evoluční strom ) je větvení schéma nebo strom ukazuje evoluční vztahy mezi různých biologických druhů nebo jiných subjektů, založené na podobnosti a rozdíly v jejich fyzikálních nebo genetické vlastnosti. Veškerý život na Zemi je součástí jediného fylogenetického stromu, který naznačuje společné předky .

V kořenovém fylogenetickém stromu každý uzel s potomky představuje odvozený nejnovější společný předek těchto potomků a délky okrajů v některých stromech lze interpretovat jako časové odhady. Každý uzel se nazývá taxonomická jednotka. Vnitřní uzly se obecně nazývají hypotetické taxonomické jednotky, protože je nelze přímo pozorovat. Stromy jsou užitečné v oblastech biologie, jako je bioinformatika , systematika a fylogenetika . Nekořeněné stromy znázorňují pouze příbuznost listových uzlů a nevyžadují, aby byl znám nebo odvozen kořen předků.

Dějiny

Myšlenka „ stromu života “ vzešla ze starověkých představ o postupu podobném žebříku z nižších do vyšších forem života (jako například ve Velkém řetězci bytí ). Raná znázornění „větvících“ fylogenetických stromů zahrnují „paleontologický diagram“ ukazující geologické vztahy mezi rostlinami a živočichy v knize Elementární geologie od Edwarda Hitchcocka (první vydání: 1840).

Charles Darwin (1859) také vytvořil jednu z prvních ilustrací a ve své klíčové knize Původ druhů zásadně popularizoval pojem evolučního „stromu“ . O více než století později evoluční biologové stále používají stromové diagramy k zobrazení evoluce, protože takové diagramy účinně zprostředkovávají koncept, že ke speciaci dochází prostřednictvím adaptivního a semi náhodného rozdělení linií. Postupem času se klasifikace druhů stala méně statickou a dynamičtější.

Termín fylogenetický neboli fylogenetický pochází ze dvou starověkých řeckých slov φῦλον ( phûlon ), což znamená „rasa, linie“ a γένεσις ( génesis ), což znamená „původ, zdroj“.

Vlastnosti

Zakořeněný strom

Kořenový fylogenetický strom optimalizovaný pro nevidomé. Nejnižší bod stromu je kořen, který symbolizuje univerzálního společného předka všech živých bytostí. Strom se větví do tří hlavních skupin: Bakterie (levá větev, písmena a až i), Archea (střední větev, písmena j až p) a Eukaryota (pravá větev, písmena q až z). Každé písmeno odpovídá skupině organismů uvedených pod tímto popisem. Tato písmena a popis je třeba převést na písmo v Braillově písmu a vytisknout na braillské tiskárně. Figurku lze vytisknout 3D zkopírováním souboru png a pomocí aplikace Cura nebo jiného softwaru vygenerovat Gcode pro 3D tisk.

Kořenový fylogenetický strom (viz dvě obrázky nahoře) je směrovaný strom s jedinečným uzlem - kořenem - odpovídajícím (obvykle imputovanému ) nejnovějšímu společnému předkovi všech entit na listech stromu. Kořenový uzel nemá nadřazený uzel, ale slouží jako nadřazený pro všechny ostatní uzly ve stromu. Kořen je tedy uzel stupně 2, zatímco ostatní vnitřní uzly mají minimální stupeň 3 (kde „stupeň“ zde označuje celkový počet příchozích a odchozích okrajů).

Nejběžnější metodou pro zakořenění stromů je použití nekontroverzní outgroup - dostatečně blízko, aby bylo možné vyvodit závěry z dat vlastností nebo molekulárního sekvenování, ale dostatečně daleko, aby to byla jasná outgroup.

Nekořenovaný strom

Nekořenovité fylogenetický strom pro myozin , je nadčeleď z proteinů .

Nekořeněné stromy ilustrují příbuznost listových uzlů, aniž by činily předpoklady o původu. Nevyžadují, aby byl známý nebo odvozený kořen předků. Nekořenové stromy lze vždy generovat z kořenových stromů jednoduchým vynecháním kořene. Naproti tomu odvození kořene stromu bez kořenů vyžaduje určité prostředky k identifikaci původu. To se obvykle provádí zahrnutím podskupiny do vstupních dat, takže kořen je nutně mezi podskupinou a zbytkem taxonů ve stromu, nebo zavedením dalších předpokladů o relativních rychlostech vývoje na každé větvi, jako je aplikace o molekulární hodiny hypotézy .

Bifurcating versus multifurcating

Kořenové i nekořenové stromy mohou být buď rozdvojené, nebo vícenásobné. Kořenový bifurkační strom má přesně dva potomky vyplývající z každého vnitřního uzlu (to znamená, že tvoří binární strom ), a nekořenovaný bifurkační strom má podobu nekořenového binárního stromu , volného stromu s přesně třemi sousedy v každém vnitřním uzlu. Naproti tomu rootovaný víceřadý strom může mít v některých uzlech více než dvě potomky a nekořenový víceřadý strom může mít v některých uzlech více než tři sousedy.

Označeno versus neoznačeno

Kořenové i nekořenové stromy mohou být označeny nebo neoznačeny. Označený strom má ke svým listům přiřazeny konkrétní hodnoty, zatímco strom bez označení, někdy nazývaný tvar stromu, definuje pouze topologii. Některé stromy založené na sekvencích postavené z malého genomického lokusu, jako je Phylotree, mají vnitřní uzly označené odvozenými haplotypy předků.

Výčet stromů

Zvýšení celkového počtu fylogenetických stromů v závislosti na počtu označených listů: nekořenové binární stromy (modré diamanty), zakořeněné binární stromy (červené kruhy) a kořenové víceplošné nebo binární stromy (zelené: trojúhelníky). Měřítko osy Y je logaritmické .

Počet možných stromů pro daný počet listových uzlů závisí na konkrétním typu stromu, ale vždy existuje více označených než neoznačených stromů, více multifunkčních než bifurkačních stromů a více zakořeněných než nekořenových stromů. Poslední rozdíl je biologicky nejrelevantnější; vzniká proto, že na nekořenovém stromě je mnoho míst, kde je možné dát kořen. Pro bifurkaci označených stromů je celkový počet zakořeněných stromů:

for , představuje počet listových uzlů.

Pro bifurkaci označených stromů je celkový počet nekořenových stromů:

pro .

Mezi označenými bifurkačními stromy se počet nekořenových stromů s listy rovná počtu kořenových stromů s listy.

Počet zakořeněných stromů rychle roste v závislosti na počtu špiček. Pro 10 tipů existuje více než možné rozdvojení stromů a počet víceřadých stromů stoupá rychleji, přibližně 7krát tolik těch druhých než těch prvních.

Počítání stromů.
Označené
listy
Binární
nekořeněné stromy
Binární
kořeny stromů
Vícenásobné
zakořeněné stromy
Všechny možné
zakořeněné stromy
1 1 1 0 1
2 1 1 0 1
3 1 3 1 4
4 3 15 11 26
5 15 105 131 236
6 105 945 1,807 2,752
7 945 10,395 28 813 39,208
8 10,395 135,135 524 897 660,032
9 135,135 2,027,025 10 791 887 12,818,912
10 2,027,025 34 459 425 247 678 399 282 137 824

Speciální druhy stromů

Dendrogram fylogeneze některých plemen psů

Dendrogram

Dendrogram je obecný název pro dřevo, ať už fylogenetické nebo ne, a tím i pro schematické znázornění fylogenetického stromu.

Cladogram

Cladogram představuje pouze větvení vzor; tj. jeho délky větví nepředstavují čas ani relativní množství změn znaků a jeho vnitřní uzly nepředstavují předky.

Chronogram Lepidoptera . V tomto fylogenetickém typu stromu jsou délky větví úměrné geologickému času.

Fylogram

Fylogram je fylogenetický strom, který má délky větví úměrné velikosti změny charakteru.

Chronogram je fylogenetický strom, který prostřednictvím délek větví výslovně představuje čas.

Dahlgrenogram

Dahlgrenogram je schéma představující příčný řez fylogenetického stromu

Fylogenetická síť

Fylogenetická síť není přísně vzato strom, ale spíše na obecnější graf , nebo orientovaný acyklický graf v případě zakořeněných sítí. Používají se k překonání některých omezení spojených se stromy.

Vřetenový diagram

Vřetenový diagram ukazující vývoj obratlovců na úrovni třídy, šířka vřeten udávající počet rodin. Vřetenové diagramy se často používají v evoluční taxonomii .

Vřetenový diagram nebo bublinový diagram se často nazývá romerogram, po jeho popularizaci americkým paleontologem Alfredem Romerem . Představuje taxonomickou rozmanitost (horizontální šířka) vůči geologickému času (svislá osa), aby odrážel kolísání hojnosti různých taxonů v čase. Vřetenový diagram však není evoluční strom: taxonomická vřetena zakrývají skutečné vztahy rodičovského taxonu s dceřiným taxonem a mají tu nevýhodu, že zahrnují parafýlii rodičovské skupiny. Tento typ diagramu se již nepoužívá v původně navržené podobě.

Korál života

Korál života

Darwin také zmínil, že korál může být vhodnější metaforou než strom . Vskutku, fylogenetické korály jsou užitečné pro zobrazovat minulý a současný život, a oni mají některé výhody oproti stromů (anastomoses povoleno, atd.).

Konstrukce

Fylogenetické stromy složené z netriviálního počtu vstupních sekvencí jsou konstruovány pomocí výpočetních fylogenetických metod. Metody distanční matice, jako je sousední spojování nebo UPGMA , které vypočítávají genetickou vzdálenost z více sekvenčních zarovnání , se implementují nejjednodušeji, ale nevyvolávají evoluční model. Mnoho metod zarovnání sekvencí, jako je ClustalW, také vytváří stromy pomocí jednodušších algoritmů (tj. Algoritmů založených na vzdálenosti) stavby stromů. Maximální šetrnost je další jednoduchá metoda odhadu fylogenetických stromů, ale implikuje implicitní model evoluce (tj. Šetrnost). Více pokročilé metody používat kritéria optimality o maximální věrohodnosti , často v rámci bayesovské a aplikovat explicitní model evoluce fylogenetického stromu odhadu. Identifikace optimálního stromu pomocí mnoha z těchto technik je náročná na NP , takže k identifikaci rozumně dobrého stromu, který odpovídá datům, se v kombinaci s funkcemi bodování stromů používají heuristické metody hledání a optimalizace .

Metody stavby stromů lze hodnotit na základě několika kritérií:

  • účinnost (jak dlouho trvá výpočet odpovědi, kolik paměti potřebuje?)
  • síla (dobře využívá data, nebo se informace plýtvají?)
  • konzistence (bude konvergovat ke stejné odpovědi opakovaně, pokud pokaždé poskytnou různá data pro stejný problém modelu?)
  • robustnost (vyrovná se dobře s porušením předpokladů podkladového modelu?)
  • falšovatelnost (upozorní nás, když není dobré ji použít, tj. když jsou porušeny předpoklady?)

Techniky stavby stromů si získaly pozornost také matematiků. Stromy lze také stavět pomocí T-teorie .

Formáty souborů

Stromy mohou být kódovány v řadě různých formátů, přičemž všechny musí představovat vnořenou strukturu stromu. Mohou nebo nemusí kódovat délky větví a další funkce. Standardizované formáty jsou zásadní pro distribuci a sdílení stromů, aniž by se spoléhaly na grafický výstup, který je těžké importovat do stávajícího softwaru. Běžně používané formáty jsou

Omezení fylogenetické analýzy

Ačkoli fylogenetické stromy produkované na základě sekvenovaných genů nebo genomových dat u různých druhů mohou poskytnout evoluční vhled, tyto analýzy mají důležitá omezení. A co je nejdůležitější, stromy, které generují, nemusí být nutně správné - nemusí nutně přesně představovat evoluční historii zahrnutých taxonů. Jako každý vědecký výsledek podléhají falšování další studií (např. Shromažďování dalších údajů, analýza stávajících údajů vylepšenými metodami). Data, na nichž jsou založena, mohou být hlučná ; Analýza může být zmatena genetickou rekombinací , horizontálním přenosem genů , hybridizací mezi druhy, které před hybridizací nebyly nejbližšími stromy, konvergentní evolucí a konzervovanými sekvencemi .

Existují také problémy se založením analýzy na jediném typu charakteru, jako je jeden gen nebo protein, nebo pouze na morfologické analýze, protože takové stromy konstruované z jiného nesouvisejícího zdroje dat se často liší od prvního, a proto je nutná velká péče při odvozování fylogenetických vztahů mezi druhy. Nejvíce to platí o genetickém materiálu, který podléhá laterálnímu přenosu genů a rekombinaci , kde různé bloky haplotypu mohou mít různou historii. V těchto typech analýz je výstupní strom fylogenetické analýzy jediného genu odhadem fylogeneze genu (tj. Genového stromu), a nikoli fylogeneze taxonů (tj. Druhového stromu), ze kterých byly tyto znaky odebrány, ačkoli v ideálním případě by si měli být oba velmi blízcí. Z tohoto důvodu vážné fylogenetické studie obecně používají kombinaci genů, které pocházejí z různých genomových zdrojů (např. Z mitochondriálních nebo plastidových vs. jaderných genomů), nebo genů, u nichž by se očekávalo, že se budou vyvíjet za různých selektivních režimů, takže homoplasie (falešná homologie ) by pravděpodobně nevyplynula z přirozeného výběru.

Když jsou zaniklé druhy zahrnuty jako koncové uzly v analýze (spíše než například pro omezení vnitřních uzlů), jsou považovány za nereprezentující přímé předky jakéhokoli existujícího druhu. Vyhynulé druhy obvykle neobsahují vysoce kvalitní DNA .

Rozsah užitečných materiálů DNA se rozšířil o pokroky v extrakčních a sekvenčních technologiích. Rozvoj technologií schopných odvodit sekvence z menších fragmentů nebo z prostorových vzorců produktů degradace DNA by dále rozšířil rozsah DNA považovaný za užitečný.

Fylogenetické stromy lze také odvodit z řady dalších datových typů, včetně morfologie, přítomnosti nebo nepřítomnosti konkrétních typů genů, inzerčních a delečních událostí - a jakéhokoli jiného pozorování, které pravděpodobně obsahuje evoluční signál.

Fylogenetické sítě se používají tam, kde rozdvojení stromů není vhodné, kvůli těmto komplikacím, které naznačují více retikulovanou evoluční historii organismů, ze kterých jsou odebrány vzorky.

Viz také

Reference

Další čtení

  • Schuh, RT a AVZ Brower. 2009. Biologická systematika: principy a aplikace (2. vyd.) ISBN  978-0-8014-4799-0
  • Manuel Lima , Kniha stromů: Vizualizace větví znalostí , 2014, Princeton Architectural Press, New York.
  • MEGA , bezplatný software pro kreslení fylogenetických stromů.
  • Gontier, N. 2011. „Vyobrazení stromu života: filozofické a historické kořeny evolučních diagramů stromů“. Evoluce, vzdělávání, dosah 4: 515–538.

externí odkazy

snímky

Všeobecné