Haplotyp - Haplotype

Molekula DNA 1 se liší od molekuly DNA 2 v jednom umístění páru bazí (C / A polymorfismus).

Haplotyp ( haploidní genotyp ) je skupina alel vede k organismu , který se dědí společně z jednoho rodiče.

Mnoho organismů obsahuje genetický materiál ( DNA ) zděděný po dvou rodičích. Normálně mají tyto organismy svou DNA organizovanou ve dvou sadách párově podobných chromozomů . Potomek dostane od každého rodiče jeden chromozom v každém páru. Sada párů chromozomů se nazývá diploidní a sada pouze jedné poloviny každého páru se nazývá haploidní. Haploidní genotyp (haplotyp) je genotyp, který zvažuje spíše singulární chromozomy než páry chromozomů. Mohou to být všechny chromozomy od jednoho z rodičů nebo menší část chromozomu, například sekvence 9000 párů bází .

Existují však i další použití tohoto výrazu. Nejprve se používá k označení souboru specifických alel (tj. Specifických sekvencí DNA ) v klastru těsně spojených genů na chromozomu, které pravděpodobně budou zděděny společně - to znamená, že budou pravděpodobně konzervovány jako sekvence která přežije sestup mnoha generací reprodukce. Druhým použitím se rozumí sada vázaných alel s jedním nukleotidovým polymorfismem (SNP), které se obvykle vyskytují vždy společně (tj. Jsou statisticky spojeny ). Předpokládá se, že identifikace těchto statistických asociací a několika alel specifické sekvence haplotypu může usnadnit identifikaci všech ostatních takových polymorfních míst, která jsou v blízkosti chromozomu. Tyto informace jsou zásadní pro vyšetřování genetiky běžných chorob ; které ve skutečnosti byly u lidí zkoumány Mezinárodním projektem HapMap . Zatřetí, mnoho společností zabývajících se genetickým testováním používá tento termín třetím způsobem: k označení individuální sbírky specifických mutací v daném genetickém segmentu; (viz krátká tandemová opakovaná mutace).

Termín „ haploskupina “ se týká mutací SNP / polymorfismu jedinečné události (UEP), které představují clade, ke kterému patří kolekce konkrétních lidských haplotypů. (Clade zde označuje soubor haplotypů sdílejících společného předka.) Haploskupina je skupina podobných haplotypů, které sdílejí společného předka s mutací polymorfismu s jedním nukleotidem . Mitochondriální DNA prochází mateřskou linií, která se může datovat tisíce let.

Rozlišení haplotypu

Genotyp organismu nemusí definovat svůj haplotyp jednoznačně. Zvažte například diploidní organismus a dva bialelické lokusy (například SNP ) na stejném chromozomu. Předpokládejme, že první místo má alely A nebo T a druhá lokus G nebo C . Oba lokusy tedy mají tři možné genotypy : ( AA , AT a TT ) a ( GG , GC a CC ). Pro daného jedince existuje na těchto dvou lokusech devět možných konfigurací (haplotypů) (zobrazených níže na Punnettově náměstí ). U jedinců, kteří jsou homozygotní na jednom nebo obou lokusech, jsou haplotypy jednoznačné - což znamená, že neexistuje žádná diferenciace haplotypu T1T2 od haplotypu T2T1; kde T1 a T2 jsou označeny, aby se ukázalo, že jsou stejným lokusem, ale označeny jako takové, aby bylo vidět, že nezáleží na tom, v jakém pořadí je považujete, konečným výsledkem jsou dva T loci. Pro jednotlivce heterozygotní v obou loci se gametic fáze je dvojznačný - v těchto případech, nevíte, který haplotyp máte např TA versus AT.

AA NA TT
GG AG AG AG TG TG TG
GC AG AC AG TC
nebo
AC TG
TG TC
CC AC AC AC TC TC TC

Jedinou jednoznačnou metodou řešení fázové nejednoznačnosti je sekvenování . Je však možné odhadnout pravděpodobnost konkrétního haplotypu, když je fáze nejednoznačná, pomocí vzorku jednotlivců.

Vzhledem k genotypům u řady jedinců lze haplotypy odvodit pomocí rozlišení haplotypu nebo technik fázování haplotypu. Tyto metody fungují uplatněním pozorování, že určité haplotypy jsou v určitých genomických oblastech běžné. Vzhledem k sadě možných rozlišení haplotypů si proto tyto metody vybírají ty, které celkově používají méně různých haplotypů. Specifika těchto metod se liší - některé jsou založeny na kombinatorických přístupech (např. Šetrnost ), zatímco jiné používají funkce pravděpodobnosti založené na různých modelech a předpokladech, jako je Hardy-Weinbergův princip , koalescentní model teorie nebo dokonalá fylogeneze. Parametry v těchto modelech se poté odhadují pomocí algoritmů, jako je algoritmus očekávání-maximalizace (EM), Markovův řetězec Monte Carlo (MCMC) nebo skryté Markovovy modely (HMM).

Mikrofluidní haplotypizace celého genomu je technika pro fyzickou separaci jednotlivých chromozomů z metafázové buňky s následným přímým rozlišením haplotypu pro každou alelu.

Haplotypy Y-DNA z genealogických testů DNA

Na rozdíl od jiných chromozomů, chromozomy Y obecně nepřicházejí v párech. Každý člověk (kromě mužů se syndromem XYY ) má pouze jednu kopii tohoto chromozomu. To znamená, že neexistuje žádná náhodná variace, která kopie se dědí, a také (u většiny chromozomů) žádné zamíchání mezi kopiemi rekombinací ; na rozdíl od autosomálních haplotypů tedy mezi generacemi vlastně neexistuje randomizace haplotypu chromozomu Y. Lidský muž by měl do značné míry sdílet stejný chromozom Y jako jeho otec, dávat nebo brát několik mutací; tedy chromozomy Y mají tendenci přecházet z velké části neporušené z otce na syna, s malým, ale hromadícím se počtem mutací, které mohou sloužit k rozlišení mužských linií. Zejména Y-DNA reprezentovaná jako očíslované výsledky genealogického testu DNA Y-DNA by se měla shodovat, s výjimkou mutací.

Výsledky UEP (výsledky SNP)

Polymorfismy jedinečných událostí (UEP), jako jsou SNP, představují haploskupiny . STR představují haplotypy. Výsledky, které zahrnují plný haplotyp Y-DNA z testu chromozomové DNA Y, lze rozdělit na dvě části: výsledky pro UEP, někdy volně nazývané výsledky SNP, protože většina UEP jsou jednonukleotidové polymorfismy , a výsledky pro mikrosatelitní krátký tandem opakované sekvence ( Y-STR ).

Výsledky UEP představují dědičnost událostí, o nichž se předpokládá, že k nim mohlo dojít pouze jednou za celou historii lidstva. Mohou být použity k identifikaci haploskupiny Y-DNA jednotlivce , jeho místa v „rodokmenu“ celého lidstva. Různé haploskupiny Y-DNA identifikují genetické populace, které jsou často zřetelně spojeny s konkrétními geografickými oblastmi; jejich výskyt v novějších populacích nacházejících se v různých regionech představuje migraci před desítkami tisíc let před přímými patrilinealními předky současných jedinců.

Haplotypy Y-STR

Genetické výsledky zahrnují také haplotyp Y-STR , soubor výsledků testovaných markerů Y-STR.

Na rozdíl od UEP, Y-STR mutují mnohem snadněji, což jim umožňuje použít k rozlišení nedávné genealogie. Ale také to znamená, že spíše než populace potomků genetické události, kteří sdílejí stejný výsledek, se haplotypy Y-STR pravděpodobně rozšířily od sebe, aby vytvořily shluk víceméně podobných výsledků. Typicky bude mít tento klastr jednoznačné nejpravděpodobnější centrum, modální haplotyp (pravděpodobně podobný haplotypu původní zakládající události), a také haplotypovou rozmanitost - do jaké míry se rozšířil. Čím dále v minulosti došlo k určující události a čím více následného populačního růstu proběhlo dříve, tím větší bude rozmanitost haplotypu pro určitý počet potomků. Pokud je však u konkrétního počtu potomků rozmanitost haplotypu menší, může to znamenat novějšího společného předka nebo nedávnou populační expanzi.

Je důležité si uvědomit, že na rozdíl od UEP, dva jedinci s podobným Y-STR haplotypem nemusí nutně sdílet podobný původ. Události Y-STR nejsou jedinečné. Místo toho se shluky výsledků haplotypu Y-STR zděděné z různých událostí a různých historií mají tendenci překrývat.

Ve většině případů je to dlouhá doba od definování událostí haploskupin, takže shluk výsledků haplotypu Y-STR spojených s potomky této události se obvykle stal poměrně širokým. Tyto výsledky budou mít tendenci významně překrývat (podobně široké) shluky haplotypů Y-STR spojené s jinými haploskupinami. To vědcům znemožňuje s naprostou jistotou předpovědět, na kterou haploskupinu Y-DNA bude haplotyp Y-STR směřovat. Pokud nejsou testovány UEP, mohou být Y-STR použity pouze k předpovědi pravděpodobností pro předky haploskupin, ale nikoli jistoty.

Podobný scénář existuje i ve snaze vyhodnotit, zda sdílená příjmení naznačují sdílený genetický původ. Shluk podobných haplotypů Y-STR může označovat sdíleného společného předka s identifikovatelným modálním haplotypem, ale pouze v případě, že je shluk dostatečně odlišný od toho, k čemu mohlo dojít náhodou od různých jedinců, kteří historicky nezávisle přijali stejný název. Mnoho jmen bylo převzato například z běžných povolání nebo bylo spojeno s obýváním konkrétních míst. K nastolení genetické genealogie je zapotřebí rozsáhlejší typizace haplotypu. Komerční společnosti pro testování DNA nyní nabízejí svým zákazníkům testování více sad markerů za účelem zlepšení definice jejich genetického původu. Počet testovaných sad markerů se zvýšil z 12 v prvních letech na 111 v poslední době.

Zjištění věrohodné souvislosti mezi různými příjmeními vytěženými z databáze je podstatně obtížnější. Výzkumník musí prokázat, že je nepravděpodobné, že by se nejbližší člen dotyčné populace, který byl z tohoto důvodu záměrně vybrán z populace, náhodou shodil. To je více než zjištění, že je nepravděpodobné, že by náhodně vybraný člen populace náhodou měl tak blízkou shodu. Z důvodu obtíží je pravděpodobné, že nebude možné stanovit souvislost mezi různými příjmeními, jako je tomu v takovém scénáři, s výjimkou zvláštních případů, kdy existují konkrétní informace, které drasticky omezí velikost populace zvažovaných kandidátů.

Rozmanitost

Haplotypová rozmanitost je měřítkem jedinečnosti konkrétního haplotypu v dané populaci. Diverzita haplotypu (H) se počítá jako: kde je (relativní) frekvence haplotypu každého haplotypu ve vzorku a je velikost vzorku. Pro každý vzorek je uvedena rozmanitost haplotypu.

Viz také

Software

  • FAMHAP - FAMHAP je software pro analýzu s jedním markerem a zejména pro společnou analýzu nefázovaných dat genotypu z těsně spojených markerů (analýza haplotypu).
  • Fuga - odhad založený na EM haplotypu a asociační testy v nesouvisejících a nukleárních rodinách.
  • HPlus - Softwarový balíček pro imputaci a testování haplotypů v asociačních studiích s použitím upravené metody, která zahrnuje algoritmus očekávání-maximalizace a Bayesovu metodu známou jako progresivní ligace.
  • HaploBlockFinder - softwarový balíček pro analýzy blokové struktury haplotypu.
  • Haploscribe - Rekonstrukce haplotypů celého chromozomu založená na všech pozicích genotypů v nukleární rodině, včetně vzácných variant.
  • Haploview - Vizualizace vazebné nerovnováhy , odhad haplotypu a značení haplotypu ( Domovská stránka ).
  • HelixTree - software pro analýzu haplotypů - haplotypová trendová regrese (HTR), haplotypické asociační testy a odhad frekvence haplotypu pomocí algoritmu očekávání-maximalizace (EM) a kompozitní metody haplotypu (CHM).
  • FÁZE - Software pro rekonstrukci haplotypu a odhad rychlosti rekombinace z údajů o populaci.
  • SHAPEIT - SHAPEIT2 je program pro odhad haplotypu genotypů SNP ve velkých kohortách v celém chromozomu.
  • SNPHAP - software založený na EM pro odhadování frekvencí haplotypů z nedůrazných genotypů.
  • WHAP - asociační analýza založená na haplotypu .

Reference

externí odkazy