Konzervované podpisy Indels - Conserved signature indels

Konzervované signatury a delece ( CSI ) v proteinových sekvencích poskytují důležitou kategorii molekulárních markerů pro pochopení fylogenetických vztahů. CSI, vyvolané vzácnými genetickými změnami, poskytují užitečné fylogenetické markery, které mají obecně definovanou velikost a jsou na obou stranách lemovány konzervovanými oblastmi, aby byla zajištěna jejich spolehlivost. Zatímco indely mohou být libovolné vložky nebo delece, CSI jsou definovány jako pouze ty proteinové indely, které jsou přítomny v konzervovaných oblastech proteinu.

CSI, které jsou omezeny na konkrétní kladu nebo skupinu druhů, obecně poskytují dobré fylogenetické markery společného evolučního původu. Vzhledem ke vzácnosti a vysoce specifické povaze těchto změn je méně pravděpodobné, že by mohly vzniknout nezávisle buď konvergentní nebo paralelní evolucí (tj. Homoplasií), a proto pravděpodobně představují synapomorfii . Jiné matoucí faktory, jako jsou rozdíly v rychlostech evoluce na různých místech nebo mezi různými druhy, také obecně neovlivňují interpretaci CSI. Stanovením přítomnosti nebo nepřítomnosti CSI v mimoskupinovém druhu lze usoudit, zda rodová forma CSI byla inzertem nebo delecí, a to lze použít k rozvoji zakořeněného fylogenetického vztahu mezi organismy.

Bylo zjištěno, že většina CSI, které byly identifikovány, vykazuje vysokou prediktivní hodnotu a obecně si zachovávají specifičnost pro původně identifikované druhy druhů. Na základě jejich přítomnosti nebo nepřítomnosti by proto mělo být možné identifikovat známé i dříve neznámé druhy patřící do těchto skupin v různých prostředích.

Typy

Specifické pro skupinu

Obrázek 1: Příklad skupinově specifického konzervovaného podpisu indel (CSI), který je specifický pro druhy z taxonu X. Čárky v zarovnání naznačují přítomnost aminokyseliny identické s aminokyselinou v horním řádku.

Skupinově specifické CSI jsou běžně sdíleny různými druhy patřícími ke konkrétnímu taxonu (např. Rod, rodina, třída, řád, kmen), ale nejsou přítomny v jiných skupinách. Tyto CSI byly s největší pravděpodobností zavedeny u předka skupiny druhů dříve, než se členové taxonů rozcházeli. Poskytují molekulární prostředky pro rozlišení členů konkrétního taxonu od všech ostatních organismů.

Obrázek 1 ukazuje příklad 5aa CSI nalezený u všech druhů patřících k taxonu X. Toto je charakteristická charakteristika tohoto taxonu, protože se nenachází u žádného jiného druhu. Tento podpis byl pravděpodobně zaveden u společného předka druhu z tohoto taxonu. Podobně mohou být sdíleny další podpisy specifické pro skupinu (nejsou zobrazeny) buď A1 a A2 nebo B1 a B2 atd., Nebo dokonce X1 a X2 nebo X3 a X4 atd. Skupiny A, B, C, D a X, v tomto diagramu by mohlo odpovídat různým bakteriálním nebo eukaryotickým kmenům.

Skupinově specifické CSI byly v minulosti použity k určení fylogenetického vztahu řady bakteriálních kmenů a podskupin v něm. Například inzert o 3 aminokyselinách byl unikátně sdílen členy kmene Thermotogae v esenciálním 50S ribozomálním proteinu L7/L12 , ve vysoce konzervované oblasti (82-124 aminokyselin). To není přítomno v žádném jiném druhu bakterií a mohlo by být použito k charakterizaci členů kmene Thermotogae ze všech ostatních bakterií. Skupinové specifické CSI byly také použity k charakterizaci podskupin v kmeni Thermotogae .

Více skupin nebo hlavní linka

Obrázek 2: Multi group or Main-Line Conserved signature indel (CSI). Čárky označují přítomnost aminokyseliny identické s horní linií.

Hlavní linie CSI jsou ty, ve kterých konzervovaný inzert nebo deleci sdílí několik hlavních kmenů, ale chybí u jiných kmenů.

Obrázek 2 ukazuje příklad 5aa CSI nalezeného v konzervované oblasti, která je běžně přítomna u druhů patřících k phyla X, Y a Z, ale chybí u jiných phyla (A, B a C). Tento podpis naznačuje specifický vztah taxonů X, Y a Z a také A, B a C. Na základě přítomnosti nebo nepřítomnosti takového indelu u druhů mimo skupinu (viz Archaea) lze odvodit, zda indel je inzert nebo delece, a která z těchto dvou skupin A, B, C nebo X, Y, Z je rodová.

CSI hlavní linie byly v minulosti používány ke stanovení fylogenetického vztahu řady bakteriálních phyla. Velký CSI asi 150-180 aminokyselin v konzervované oblasti gyrázy B (mezi aminokyselinami 529-751) je běžně sdílen mezi různými druhy Proteobacteria , Chlamydiales , Planctomycetes a Aquificales . Tento CSI chybí v jiných rodových bakteriálních kmenech, stejně jako v Archaea . Podobně velký CSI asi 100 aminokyselin v homologech RpoB (mezi aminokyselinami 919-1058) je přítomen u různých druhů patřících k Proteobacteria , Bacteroidetes-Chlorobi , Chlamydiales , Planctomycetes a Aquificales . Tento CSI chybí v jiných rodových bakteriálních kmenech, stejně jako v Archaea . V obou případech lze usuzovat, že skupiny postrádající CSI jsou rodové.

Evoluční studie založené na CSI

Obrázek 3: Zřetězený proteinový strom ukazující fylogenetický vztah skupiny Thermotogae. Je uveden počet CSI, které podporují pořadí větvení.
Obrázek 4: Zřetězený proteinový strom ukazující fylogenetický vztah dvou kmenů Archaea. Je uveden počet CSI, které podporují pořadí větvení.
Obrázek 5: Zřetězený proteinový strom ukazující fylogenetický vztah skupiny Pasteurellales. Je uveden počet CSI, které podporují pořadí větvení.

Klíčovým problémem bakteriální fylogeneze je porozumět tomu, jak jsou různé bakteriální druhy navzájem propojeny a jejich pořadí větvení od společného předka. V současné době je většina fylogenetických stromů založena na 16S rRNA nebo jiných genech/proteinech. Tyto stromy nejsou vždy schopny vyřešit klíčové fylogenetické otázky s vysokou mírou jistoty. V posledních letech však při tomto hledání pomohl objev a analýzy konzervovaných indelů (CSI) v mnoha univerzálně distribuovaných proteinech. Předpokládá se, že genetické události, které k nim vedly, se vyskytly v důležitých evolučních větvích a jejich vzorce distribuce druhů poskytují cenné informace týkající se pořadí větvení a vzájemných vztahů mezi různými bakteriálními phylami.

Thermotogae

V poslední době byl fylogenetický vztah skupiny Thermotogae charakterizován na základě přístupu CSI. Dříve nebyly známy žádné biochemické nebo molekulární markery, které by dokázaly jasně odlišit druhy tohoto kmene od všech ostatních bakterií. Bylo objeveno více než 60 CSI, které byly specifické pro celý kmen Thermotogae nebo jeho různé podskupiny. 18 CSI je jedinečně přítomno v různých druzích Thermotogae a poskytuje molekulární markery pro kmen. Kromě toho existovalo mnoho CSI, které byly specifické pro různé podskupiny termotogae. 12 CSI bylo specifických pro kladu sestávající z různých druhů Thermotoga kromě Tt. Lettingae. 14CSI byly specifické pro kladu sestávající z rodů Fervidobacterium a Thermosipho a 18 CSI bylo specifických pro rod Thermosiphon.

Bylo hlášeno 16 CSI, které byly sdíleny některými nebo všemi druhy Thermotogae nebo některými druhy z jiných taxonů, jako jsou Archaea , Aquificae , Firmicutes , Proteobacteria , Deinococcus , Fusobacteria , Dictyoglomus , Chloroflexi a eukaryotes . Sdílená přítomnost některých z těchto CSI může být způsobena laterálním genovým přenosem (LGT) mezi těmito skupinami. Počet CSI, které jsou běžně sdíleny s jinými taxony, je však mnohem menší než těch, které jsou specifické pro Thermotogae, a nevykazují žádný specifický vzorec. Nemají tedy žádný významný vliv na rozlišení Thermotogae.

Archaea

Mesophillic Crenarchaeotes byly nedávno umístěny do nového kmene z Archaea volal Thaumarchaeota . Existuje však velmi málo molekulárních markerů, které mohou odlišit tuto skupinu archea od kmene Crenarchaeota. Byla provedena podrobná fylogenetická studie využívající přístup CSI, aby se tyto fyly odlišily molekulárně. V různých Thaumarchaeotách bylo unikátně nalezeno 6 CSI, konkrétně Cenarchaeum symbiosum , Nitrosopumilus maritimus a řada nekultivovaných mořských crenarchaeotes. Byly nalezeny 3 CSI, které byly běžně sdíleny mezi druhy patřícími do Thaumarchaeota a Crenarchaeota. Kromě toho byla nalezena řada CSI, které jsou specifické pro různé řády Crenarchaeota- 3 CSI pro Sulfolobales , 5 CSI pro Thermoproteales , nakonec 2 CSI společné pro Sulfolobales a Desulfurococcales . Popsané podpisy poskytují nové prostředky pro rozlišení Crenarchaeota a Thaumarchaeota, navíc by mohly být použity jako nástroj pro klasifikaci a identifikaci příbuzných druhů.

Pasteurellales

Členové řádu Pasteurellales se v současné době rozlišují především na základě své pozice ve větvení stromu 16srRNA. V současné době je známo velmi málo molekulárních markerů, které dokážou odlišit členy tohoto řádu od jiných bakterií. K objasnění fylogenetických vztahů mezi druhy v tomto pořadí byl nedávno použit přístup CSI; bylo objeveno více než 40 CSI, které byly jednoznačně sdíleny všemi nebo většinou druhů. V rámci tohoto Pasteurellales se tvoří dva hlavní klady: Clade I, zahrnující Aggregatibacter , Pasteurella , Actinobacillus succinogenes, Mannheimia succiniciproducens, Haemophilus influenzae a Haemophilus somnus, byl podporován 13 CSI. Clade II, zahrnující Actinobacillus pleuropneumoniae, Actinobacillus minor, Haemophilus ducreyi , Mannheimia haemolytica a Haemophilus parasuis, podpořilo 9 CSI. Na základě těchto výsledků bylo navrženo, aby Pasteurellales byly rozděleny ze své současné jedné rodiny na dvě různé. Popsané podpisy by navíc poskytly nový způsob identifikace neobjevených druhů Pasteurellales.

Gammaproteobacteria

Třída Gammaproteobacteria tvoří jednu z největších skupin bakterií. V současné době se odlišuje od ostatních bakterií pouze fylogenetickými stromy založenými na 16s rRNA . Nejsou známy žádné molekulární charakteristiky jedinečné pro třídu nebo její různé podskupiny. Byla provedena podrobná studie založená na CSI s cílem lépe porozumět fylogenezi této třídy. Nejprve byl vytvořen fylogenetický strom založený na zřetězených sekvencích řady univerzálně distribuovaných proteinů. Větvení pořadí různých řádů na třídě Gammaproteobacteria (od nejnovějšího po nejstarší rozbíhající) bylo: Enterobacteriales > Pasteurellales > Vibrionales , Aeromonadales > Alteromonadales > Oceanospirillales , Pseudomonadales > Chromatiales , Legionellales , Methylococcales , Xanthomonadales , Cardiobacteriales , Thiotrichales . Kromě toho byly objeveny 4 CSI, které byly jedinečné pro většinu druhů třídy Gammaproteobacteria. Delece 2 aa v AICAR transformyláze byla jedinečně sdílena všemi gammaproteobacteria kromě Francisella tularensis . Delece 4 aa v podjednotce RNA polymerázy b a 1 aa delece v ribozomálním proteinu L16 byla nalezena jedinečně u různých druhů patřících do řad Enterobacteriales , Pasteurellales , Vibrionales , Aeromonadales a Alteromonadales , ale nebyla nalezena u jiných gammaproteobakterií. A konečně, delece 2 aa v leucyl-tRNA syntetáze byla běžně přítomna ve výše uvedených řádech třídy Gammaproteobacteria a u některých členů řádu Oceanospirillales . Další studie založená na CSI také identifikovala 4 CSI, které jsou exkluzivní pro řád Xanthomonadales. Dohromady tato dvě fakta ukazují, že Xanthomonadales je monofyletická skupina, která je rodová pro jiné Gammaproteobacteria, což dále ukazuje, že Xanthomonadales je nezávislá subdivize a představuje jednu z nejhlubších rozvětvených linií v kladu Gammaproteobacteria.

Houby

Přesný fylogenetický vztah mezi rostlinami , zvířaty a houbami není dobře znám. K objasnění tohoto vztahu byla provedena malá studie založená na CSI. Čtyři CSI byly použity k umístění zvířat a hub společně jako monofyletická skupina a vyloučení rostlin. Tyto CSI byly nalezeny ve dvou esenciálních buněčných proteinech, faktoru prodloužení 1 a enoláze . Tento specifický vztah mezi houbami a zvířaty však tradičně nebyl podporován.

Reference