Xeon Phi - Xeon Phi

Xeon Phi
Intel Xeon Phi 5100.jpg
Obecná informace
Spuštěno 2010
Přerušeno 2020
Výkon
Max. Taktovací frekvence CPU 1,053 GHz až 1,7 GHz
Mezipaměti
Mezipaměť L1 32  KB na jádro
Mezipaměť L2 512  kB na jádro
Architektura a klasifikace
Architektura x86-64
Rozšíření
Fyzické specifikace
Tranzistory
Jádra
Zásuvka
Produkty, modely, varianty
Název značky

Xeon Phi je řada x86 manycore procesorů navržených a vyrobených společností Intel . Je určen pro použití v superpočítačích, serverech a špičkových pracovních stanicích. Jeho architektura umožňuje použití standardních programovacích jazyků a aplikačních programovacích rozhraní (API), jako je OpenMP .

Protože byl původně založen na dřívějším návrhu GPU (s kódovým označením „Larrabee“ ) od společnosti Intel, který byl zrušen v roce 2009, sdílí aplikační oblasti s GPU. Hlavní rozdíl mezi Xeon Phi a GPGPU, jako je Nvidia Tesla, je ten, že Xeon Phi s jádrem kompatibilním s x86 může s menšími úpravami spouštět software, který byl původně zaměřen na standardní procesor x86. Bylo přerušeno kvůli nedostatku poptávky a problémům Intelu s jeho 10nm uzlem.

Zpočátku ve formě přídavných karet založených na PCIe byl v červnu 2013 oznámen produkt druhé generace s kódovým označením Knights Landing . Tyto čipy druhé generace mohly být použity spíše jako samostatný procesor než jen jako doplněk Kartu.

Tianhe-2 superpočítač používá procesory Xeon Phi.

V červnu 2013 byl superpočítač Tianhe-2 v Národním superpočítačovém centru v Guangzhou (NSCC-GZ) vyhlášen nejrychlejším superpočítačem na světě (od června 2018 je to č. 4). K dosažení 33,86 petaFLOPS používalo koprocesory Intel Xeon Phi a procesory Ivy Bridge -EP Xeon.

Produktová řada Xeon Phi přímo konkuroval Nvidia s Tesla a AMD Radeon Instinct linek hlubokého učení a GPGPU karet.

Dějiny

Krycí jméno Technologie Komentáře
Rytíři Ferry 45 nm nabízen jako karta PCIe; odvozeno z projektu Larrabee
Rytířský koutek 22 nm odvozeno od P54C; jednotka pro zpracování vektorů; první zařízení, které bude oznámeno jako Xeon Phi
Přistání rytířů 14 nm odvozeno od Silvermont/Airmont (Intel Atom); AVX-512
Rytířský mlýn 14 nm téměř identický s Knights Landing, ale optimalizovaný pro hluboké učení
Knights Hill 10 nm zrušeno

Pozadí

Larrabee mikroarchitektuře (ve vývoji od roku 2006) představil velmi široký (512-bit) SIMD jednotky až po x86 designu architektura na bázi procesoru, prodloužena do mezipaměti koherentní multiprocesorovém systému připojeného přes kruhový autobus do paměti; každé jádro bylo schopné čtyřcestného multithreadingu. Vzhledem k tomu, že design byl určen pro GPU i pro obecné účely, čipy Larrabee obsahovaly také specializovaný hardware pro vzorkování textur. Projekt výroby maloobchodního produktu GPU přímo z výzkumného projektu Larrabee byl ukončen v květnu 2010.

Další současný Intel výzkumný projekt zavádění x86 architektury na mnoho-vícejádrové procesory byl ‚ Single-chip Cloud Computer ‘ (prototyp představen 2009), design napodobující cloud computing počítačová datacentrum na jediném čipu s několika nezávislými jádry: prototyp návrhu zahrnuty 48 jader na čip s hardwarovou podporou pro selektivní řízení frekvence a napětí jader pro maximalizaci energetické účinnosti a integrovaná síťová síť pro mezičipové zasílání zpráv. Návrh postrádal koherentní jádra v mezipaměti a soustředil se na principy, které by umožnily návrh škálovat na mnohem více jader.

Teraflopech Research Chip (prototyp představen 2007) je experimentální 80-core čip s dvěma s plovoucí čárkou se jednotek na jádro, se provádí 96-bit VLIW architekturu místo x86. Projekt zkoumal metody intercore komunikace, správu napájení na čip a dosáhl 1,01  TFLOPS při 3,16 GHz při spotřebě 62 W energie.

Rytíři Ferry

Prototypová deska společnosti Intel s mnoha integrovanými jádry (MIC), pojmenovaná Knights Ferry , obsahující procesor s kódovým označením Aubrey Isle, byla oznámena 31. května 2010. Tento produkt byl uveden jako derivát projektu Larrabee a dalšího výzkumu společnosti Intel včetně cloudového počítače s jedním čipem .

Vývojový produkt byl nabízen jako karta PCIe s 32 jádry v pořadí na frekvenci až 1,2 GHz se čtyřmi vlákny na jádro, 2 GB paměti GDDR5 a 8 MB soudržné mezipaměti L2 (256 kB na jádro s 32 kB mezipaměti L1) a příkon ~ 300 W, postavený na 45 nm procesu. V jádru Aubrey Isle propojuje procesory s hlavní pamětí 1024bitová kruhová sběrnice (512bitová obousměrná). Výkon jedné desky překročil 750 GFLOPS. Prototypové desky podporují pouze pokyny s plovoucí desetinnou čárkou s jednoduchou přesností .

Počáteční vývojáři zahrnovali CERN , Korea Institute of Science and Technology Information (KISTI) a Leibniz Supercomputing Center . Mezi výrobce hardwaru prototypových desek patřily společnosti IBM, SGI, HP, Dell a další.

Rytířský koutek

Knights Corner produkt je vyráběn v 22 nm velikosti procesu, pomocí Intel Tri-gate technologie s více než 50 jader na čipu, a je první řada-jádra komerční produkt společnosti Intel.

V červnu 2011 společnost SGI oznámila partnerství se společností Intel, aby ve svých vysoce výkonných výpočetních produktech používala architekturu MIC. V září 2011 bylo oznámeno, že Texas Advanced Computing Center (TACC) bude používat karty Knights Corner ve svém superpočítači „Stampede“ s 10 petaFLOPS a poskytne 8 petaFLOPS výpočetního výkonu. Podle „Stampede: A Comprehensive Petascale Computing Environment“ budou „MIC druhé generace Intel (Knights Landing) přidány, až budou k dispozici, což zvýší celkový špičkový výkon Stampede na minimálně 15 PetaFLOPS“.

Dne 15. listopadu 2011 společnost Intel ukázala ranou křemíkovou verzi procesoru Knights Corner.

Dne 5. června 2012 společnost Intel vydala open source software a dokumentaci týkající se Knights Corner.

Dne 18. června 2012 společnost Intel na mezinárodní superpočítačové konferenci v Hamburku v roce 2012 oznámila, že Xeon Phi bude obchodní značka používaná pro všechny produkty na základě jejich architektury Many Integrated Core. V červnu 2012 Cray oznámil, že bude nabízet 22 nm čipy 'Knight's Corner' (značené jako 'Xeon Phi') jako koprocesor ve svých systémech 'Cascade'.

V červnu 2012 ScaleMP oznámil aktualizaci virtualizace, která umožňuje Xeon Phi jako transparentní rozšíření procesoru a umožňuje spouštění staršího kódu MMX / SSE bez změn kódu. Důležitou součástí jádra koprocesoru Intel Xeon Phi je jeho jednotka pro zpracování vektorů (VPU). VPU obsahuje novou 512bitovou sadu instrukcí SIMD, oficiálně známou jako Intel Initial Many Core Instructions (Intel IMCI). VPU tedy může provést 16 operací s jednou přesností (SP) nebo 8 operací s dvojitou přesností (DP) za cyklus. VPU také podporuje pokyny FMA (Fused Multiply-Add), a proto může provádět 32 SP nebo 16 DP operací s pohyblivou řádovou čárkou za cyklus. Poskytuje také podporu celých čísel. VPU také obsahuje rozšířenou matematickou jednotku (EMU), která může provádět operace, jako je reciproční, odmocnina a logaritmus, což umožňuje provádění těchto operací vektorovým způsobem s velkou šířkou pásma. EMU funguje na základě výpočtu polynomických aproximací těchto funkcí.

Dne 12. listopadu 2012 společnost Intel oznámila dvě rodiny koprocesorů Xeon Phi využívající velikost procesu 22 nm: Xeon Phi 3100 a Xeon Phi 5110P. Xeon Phi 3100 bude schopen více než 1 teraFLOPS instrukcí s plovoucí desetinnou čárkou s dvojitou přesností a šířkou pásma paměti 240 GB/s při 300 W. Xeon Phi 5110P bude schopen 1,01 teraFLOPS instrukcí s dvojitou přesností s plovoucí desetinnou čárkou s Šířka pásma paměti 320 GB/s při 225 W. Xeon Phi 7120P bude schopen 1,2 teraFLOPS instrukcí s dvojitou přesností s plovoucí desetinnou čárkou s šířkou pásma paměti 352 GB/s při 300 W.

Dne 17. června 2013 byl superpočítač Tianhe-2 vyhlášen společností TOP500 jako nejrychlejší na světě. Tianhe-2 použil procesory Intel Ivy Bridge Xeon a Xeon Phi k dosažení 33,86 petaFLOPS. Bylo to nejrychlejší na seznamu za dva a půl roku, naposledy v listopadu 2015.

Návrh a programování

Jádra Knights Corner vycházejí z upravené verze designu P54C , použité v původním Pentiu. Základem architektury Intel MIC je využít dědictví x86 vytvořením architektury více procesorů kompatibilní s x86, která může využívat stávající softwarové nástroje pro paralelizaci. Mezi programovací nástroje patří OpenMP , OpenCL , Cilk / Cilk Plus a specializované verze knihoven Intel Fortran, C ++ a math.

Mezi konstrukční prvky převzaté z projektu Larrabee patří x86 ISA, 4cestný SMT na jádro, 512bitové jednotky SIMD, instrukční mezipaměť 32 kB L1, datová mezipaměť 32 kB L1, soudržná mezipaměť L2 (512 kB na jádro) a ultraširoký kruhová sběrnice spojující procesory a paměť.

Pokyny 512bitové SIMD Knights Corner sdílejí mnoho vnitřních funkcí s rozšířením AVX-512. Dokumentace instrukční sady je k dispozici od společnosti Intel pod názvem rozšíření KNC.

Modely řady Xeon Phi
X100
název Sériové číslo Jádra
( vlákna @ 4x jádro)
Hodiny (MHz)
Mezipaměť L2
Paměť GDDR5 ECC Peak DP
Compute
(GFLOPS)
TDP
(W)
Chladicí
systém
Form Factor Vydáno
Základna Turbo Množství Kanály ČB
GB/s
Xeon Phi 3110X SE3110X 061 (244) 1053 - 30,5 MB 06 GB 12 240 1028 300 Holé prkno Karta PCIe 2.0 x16 Listopadu 2012
08 GB 16 320
Xeon Phi 3120A SC3120A 057 (228) 1100 - 28,5 MB 06 GB 12 240 1003 300 Ventilátor/chladič 17. června 2013
Xeon Phi 3120P SC3120P 057 (228) 1100 - 28,5 MB 06 GB 12 240 1003 300 Pasivní chladič 17. června 2013
Xeon Phi 31S1P BC31S1P 057 (228) 1100 - 28,5 MB 08 GB 16 320 1003 270 Pasivní chladič 17. června 2013
Xeon Phi 5110P SC5110P 060 (240) 1053 - 30,0 MB 08 GB 16 320 1011 225 Pasivní chladič 12. listopadu 2012
Xeon Phi 5120D SC5120D 060 (240) 1053 - 30,0 MB 08 GB 16 352 1011 245 Holé prkno SFF 230pinová karta 17. června 2013
BC5120D
Xeon Phi SE10P SE10P 061 (244) 1100 - 30,5 MB 08 GB 16 352 1074 300 Pasivní chladič Karta PCIe 2.0 x16 12. listopadu 2012
Xeon Phi SE10X SE10X 061 (244) 1100 - 30,5 MB 08 GB 16 352 1074 300 Holé prkno 12. listopadu 2012
Xeon Phi 7110P SC7110P 061 (244) 1100 1250 30,5 MB 16 GB 16 352 1220 300 Pasivní chladič ???
Xeon Phi 7110X SC7110X 061 (244) 1250 ??? 30,5 MB 16 GB 16 352 1220 300 Holé prkno ???
Xeon Phi 7120A SC7120A 061 (244) 1238 1333 30,5 MB 16 GB 16 352 1208 300 Ventilátor/chladič 06.04.2014
Xeon Phi 7120D SC7120D 061 (244) 1238 1333 30,5 MB 16 GB 16 352 1208 270 Holé prkno SFF 230pinová karta Březen ??, 2014
Xeon Phi 7120P SC7120P 061 (244) 1238 1333 30,5 MB 16 GB 16 352 1208 300 Pasivní chladič Karta PCIe 2.0 x16 17. června 2013
Xeon Phi 7120X SC7120X 061 (244) 1238 1333 30,5 MB 16 GB 16 352 1208 300 Holé prkno 17. června 2013

Přistání rytířů

Přistávací procesor Intel Xeon Phi Knights
Stejný procesor, delidded
Výstřel

Kódový název produktu druhé generace architektury MIC od společnosti Intel. Společnost Intel oficiálně poprvé odhalila podrobnosti o svých produktech druhé generace Intel Xeon Phi dne 17. června 2013. Intel uvedl, že příští generace produktů založených na architektuře Intel MIC Architecture bude k dispozici ve dvou formách, jako koprocesor nebo hostitelský procesor (CPU), a musí být vyroben s použitím Intel 14 nm výrobní technologie. Produkty Knights Landing budou zahrnovat integrovanou paměť v balíčku pro výrazně vyšší šířku pásma paměti.

Knights Landing obsahuje až 72 jader Airmont (Atom) se čtyřmi vlákny na jádro, využívající patici LGA 3647 podporující až 384 GB „vzdálené“ paměti DDR4 2133 RAM a 8–16 GB skládané „blízké“ 3D  MCDRAM , verze Hybridní paměťová kostka . Každé jádro má dvě 512bitové vektorové jednotky a podporuje instrukce AVX-512 SIMD, konkrétně Intel AVX-512 Foundational Instructions (AVX-512F) s Intel AVX-512 Conflict Detection Instructions (AVX-512CD), Intel AVX-512 Exponential a Reciproční instrukce (AVX-512ER) a Intel AVX-512 Prefetch Instructions (AVX-512PF). Podpora pro IMCI byla odebrána ve prospěch AVX-512.

National Energy Research Scientific Computing Center oznámila, že fáze 2 svého nejnovějšího superpočítačového systému "Cori" by používal Knights Landing Xeon Phi koprocesory.

Dne 20. června 2016 společnost Intel uvedla na trh řadu produktů Intel Xeon Phi x200 založenou na architektuře Knights Landing, přičemž zdůraznila její použitelnost nejen na tradiční úlohy simulace, ale také na strojové učení . Modelová řada oznámená při spuštění zahrnovala pouze Xeon Phi zaváděcího formátu, ale dvě její verze: standardní procesory a procesory s integrovanou architekturou Intel Omni-Path . Ten je označen příponou F v čísle modelu. Očekává se, že integrovaná tkanina poskytne lepší latenci za nižší cenu než diskrétní vysoce výkonné síťové karty.

Dne 14. listopadu 2016 obsahoval 48. seznam TOP500 10 systémů využívajících platformy Knights Landing.

PCIe založený koprocesor varianta Rytířském přistání nebyl nikdy určen pro širokou trhu a byla ukončena v srpnu 2017. To zahrnovalo 7220A, 7240P a 7220P koprocesor karty.

Intel oznámil, že v létě 2018 ukončují hru Knights Landing.

Modely

Všechny modely mohou zvýšit své špičkové rychlosti a přidat 200 MHz k základní frekvenci, pokud běží pouze jedno nebo dvě jádra. Při běhu ze tří na maximální počet jader mohou čipy posílit pouze 100 MHz nad základní frekvenci. Všechny čipy používají kód AVX na frekvenci snížené o 200 MHz.


Řada Xeon Phi 7200
sSpec
číslo
Jádra
(vlákna)
Hodiny (MHz)
Mezipaměť L2
Paměť MCDRAM Paměť DDR4 Špičkový
výpočet DP
TDP
(W)
Zásuvka Datum vydání Číslo dílu
Základna Turbo Množství ČB Kapacita ČB
Xeon Phi 7210 SR2ME (B0) 64 (256) 1300 1500 32 MB 16 GB 400+ GB/s 384 GB 102,4 GB/s 2662
GFLOPS
215 SVLCLGA3647 20. června 2016 HJ8066702859300
SR2X4 (B0)
Xeon Phi 7210F SR2X5 (B0) 230 HJ8066702975000
Xeon Phi 7230 SR2MF (B0) 215 HJ8066702859400
SR2X3 (B0)
Xeon Phi 7230F SR2X2 (B0) 230 HJ8066702269002
Xeon Phi 7250 SR2MD (B0) 68 (272) 1400 1600 34 MB 3046
GFLOPS
215 HJ8066702859200
SR2X1 (B0)
Xeon Phi 7250F SR2X0 (B0) 230 HJ8066702268900
Xeon Phi 7290 SR2WY (B0) 72 (288) 1500 1700 36 MB 3456
GFLOPS
245 HJ8066702974700
Xeon Phi 7290F SR2WZ (B0) 260 HJ8066702975200

Knights Hill

Knights Hill bylo kódové označení architektury MIC třetí generace, pro kterou Intel oznámil první detaily na SC14. Měl být vyroben 10 nm procesem.

Očekávalo se, že Knights Hill bude použit v superpočítači amerického ministerstva energetiky Aurora , který bude nasazen v Národní laboratoři Argonne . Aurora však měla zpoždění ve prospěch použití „pokročilé architektury“ se zaměřením na strojové učení.

V roce 2017 společnost Intel oznámila, že Knights Hill byla zrušena ve prospěch jiné architektury postavené od základů, aby v budoucnu umožnila výpočet Exascale . Tato nová architektura se nyní očekává v letech 2020–2021.

Rytířský mlýn

Knights Mill je kódové označení společnosti Intel pro produkt Xeon Phi specializovaný na hloubkové učení , původně vydaný v prosinci 2017. Téměř identický ve specifikacích jako Knights Landing, Knights Mill obsahuje optimalizace pro lepší využití instrukcí AVX-512 a umožňuje čtyřsměrné hypervlákno . Zvýšil se výkon s plovoucí desetinnou čárkou s jednoduchou a proměnnou přesností na úkor výkonu s plovoucí desetinnou čárkou s dvojitou přesností.

Modely

Řada Xeon Phi 72x5
sSpec číslo Jádra
(vlákna)
Hodiny (MHz)
Mezipaměť L2
Paměť MCDRAM Paměť DDR4 Špičkový
výpočet DP
TDP
(W)
Zásuvka Datum vydání Číslo dílu
Základna Turbo Množství ČB Kapacita ČB
Xeon Phi 7235 SR3VF (A0) 64 (256) 1300 1400 32 MB 16 GB 400+ GB/s 384 GB 102,4 GB/s TBA 250 SVLCLGA3647 4. čtvrtletí 2017 HJ8068303823900
Xeon Phi 7285 SR3VE (A0) 68 (272) 1300 1400 34 MB 115,2 GB/s TBA 250 HJ8068303823800
Xeon Phi 7295 SR3VD (A0) 72 (288) 1500 1600 36 MB 115,2 GB/s TBA 320 HJ8068303823700

Programování

Vědci provedli empirickou studii výkonu a programovatelnosti, ve které autoři tvrdí, že dosažení vysokého výkonu s Xeon Phi stále potřebuje pomoc programátorů a že pouhé spoléhání se na kompilátory s tradičními programovacími modely je stále daleko od reality. Výzkum v různých oblastech, jako jsou biologické vědy, a hluboké učení však prokázaly, že využíváním paralelnosti vláken a SIMD Xeon Phi se dosáhne významného zrychlení.

Konkurenti

Viz také

Reference

externí odkazy