Paměť s vysokou šířkou pásma - High Bandwidth Memory

Prořízněte grafickou kartu, která využívá paměť s vysokou šířkou pásma. Viz průchozí křemíkové průchodky (TSV).

High Bandwidth Memory ( HBM ) je vysokorychlostní počítačové paměťové rozhraní pro 3D skládanou synchronní dynamickou paměť s náhodným přístupem (SDRAM) původně od společností Samsung , AMD a SK Hynix . Používá se ve spojení s vysoce výkonnými grafickými akcelerátory, síťovými zařízeními, vysoce výkonnými AI ASIC a FPGA datových center a v některých superpočítačích (například NEC SX-Aurora TSUBASA a Fujitsu A64FX ). První paměťový čip HBM vyrobila společnost SK Hynix v roce 2013 a prvními zařízeními, která používaly HBM, byly grafické karty AMD Fiji v roce 2015.

Paměť s vysokou šířkou pásma byla přijata společností JEDEC jako průmyslový standard v říjnu 2013. Druhá generace, HBM2 , byla společností JEDEC přijata v lednu 2016.

Technologie

HBM dosahuje vyšší šířky pásma při použití menšího výkonu v podstatně menším formátu než DDR4 nebo GDDR5 . Toho je dosaženo stohováním až osmi DRAM matric a volitelné základní matrice, která může zahrnovat obvody vyrovnávací paměti a testovací logiku. Zásobník je často připojen k řadiči paměti na GPU nebo CPU prostřednictvím substrátu, jako je například silikonový interposer . Alternativně může být paměťová kostka stohována přímo na čip CPU nebo GPU. V zásobníku jsou raznice svisle propojeny průchozími křemíkovými průchodkami (TSV) a mikrobumpy . Technologie HBM je v zásadě podobná, ale nekompatibilní s rozhraním Hybrid Memory Cube (HMC) vyvinutým společností Micron Technology .

Paměťová sběrnice HBM je velmi široká ve srovnání s jinými pamětmi DRAM, jako jsou DDR4 nebo GDDR5. Balíček HBM se čtyřmi DRAM matricemi (4 -Hi) má dva 256bitové kanály na matrici pro celkem 8 kanálů a šířku celkem 1024 bitů. Grafická karta/GPU se čtyřmi 4 -Hi HBM stohy by tedy měla paměťovou sběrnici o šířce 4096 bitů. Pro srovnání, šířka sběrnice pamětí GDDR je 32 bitů se 16 kanály pro grafickou kartu s 512bitovým paměťovým rozhraním. HBM podporuje až 4 GB na balíček.

Vyšší počet připojení k paměti, vzhledem k DDR4 nebo GDDR5, vyžadoval nový způsob připojení paměti HBM k GPU (nebo jinému procesoru). AMD i Nvidia používají k propojení paměti a GPU účelově vytvořené křemíkové čipy, nazývané interposery . Tento interposer má další výhodu v tom, že vyžaduje fyzickou blízkost paměti a procesoru, což snižuje paměťové cesty. Protože je však výroba polovodičových součástek výrazně dražší než výroba desek s plošnými spoji , zvyšuje to náklady na konečný produkt.

Rozhraní

HBM DRAM je pevně spojen s hostitelskou výpočetní matricí s distribuovaným rozhraním. Rozhraní je rozděleno na nezávislé kanály. Kanály jsou na sobě zcela nezávislé a nejsou nutně navzájem synchronní. HBM DRAM využívá architekturu širokého rozhraní k dosažení vysokorychlostního provozu s nízkým výkonem. HBM DRAM používá 500 MHz diferenciální hodiny CK_t / CK_c (kde přípona „_t“ označuje „skutečnou“ nebo „kladnou“ složku diferenciálního páru a „_c“ znamená „doplňkovou“). Příkazy jsou registrovány na náběžné hraně CK_t, CK_c. Každé kanálové rozhraní udržuje 128bitovou datovou sběrnici pracující s dvojnásobnou datovou rychlostí (DDR). HBM podporuje přenosové rychlosti 1  GT/s na pin (přenos 1 bit), čímž poskytuje celkovou šířku pásma balíčku 128 GB/s.

HBM2

Druhá generace vysokorychlostní paměti HBM2 také udává až osm matric na jeden zásobník a zdvojnásobuje přenosové rychlosti pinů až 2  GT/s . Díky zachování širokého přístupu 1024bitů dokáže HBM2 dosáhnout šířky pásma paměti 256 GB/s na balíček. Specifikace HBM2 umožňuje až 8 GB na balíček. Předpokládá se, že HBM2 bude obzvláště užitečný pro spotřebitelské aplikace citlivé na výkon, jako je virtuální realita .

19. ledna 2016 společnost Samsung oznámila ranou sériovou výrobu HBM2, a to až 8 GB na zásobník. SK Hynix také oznámila dostupnost 4 GB stacků v srpnu 2016.

HBM2E

Na konci roku 2018 oznámil JEDEC aktualizaci specifikace HBM2, která zajišťuje větší šířku pásma a kapacity. V oficiální specifikaci je nyní podporováno až 307 GB/s na zásobník (efektivní přenosová rychlost 2,5 Tbit/s), i když produkty s touto rychlostí již byly k dispozici. Aktualizace navíc přidala podporu pro 12 -Hi stacky (12 matric), což umožňuje kapacitu až 24 GB na stack.

20. března 2019 společnost Samsung oznámila svůj Flashbolt HBM2E s osmi matricemi na zásobník, přenosovou rychlostí 3,2  GT/s , což poskytuje celkem 16 GB a 410 GB/s na zásobník.

12. srpna 2019, SK Hynix oznámila svůj HBM2E, který obsahuje osm matric na stack, přenosovou rychlost 3,6  GT/s , celkem 16 GB a 460 GB/s na stack. Dne 2. července 2020 společnost SK Hynix oznámila, že byla zahájena sériová výroba.

HBM3

Na konci roku 2020 společnost Micron odhalila, že bude aktualizován standard HBM2E, a současně představila další standard známý jako HBMnext (později přejmenovaný na HBM3). Jedná se o velký generační skok od HBM2 a nahrazení HBM2E. Tato nová VRAM přijde na trh ve 4. čtvrtletí roku 2022. To pravděpodobně představí novou architekturu, jak naznačuje název.

Zatímco architektura může být přepracována, úniky ukazují na výkon, který je podobný jako u aktualizovaného standardu HBM2E. Tato RAM bude pravděpodobně používána převážně v GPU datových center .

V polovině roku 2021 společnost SK Hynix představila některé specifikace standardu HBM3 s rychlostmi I/O 5,2 Gbit/s a šířkou pásma 665 GB/s na jeden balíček a také až 16 vysokými 2,5D a 3D řešeními.

HBM-PIM

V únoru 2021 společnost Samsung oznámila vývoj HBM se zpracováním v paměti. Tato nová paměť přináší výpočetní schopnosti AI do paměti, aby se zvýšilo zpracování dat ve velkém měřítku. V každé úrovni paměti je umístěn AI engine optimalizovaný pro DRAM, který umožňuje paralelní zpracování a minimalizuje pohyb dat. Samsung tvrdí, že to přinese dvojnásobný výkon systému a sníží spotřebu energie o více než 70%, aniž by ve zbytku systému vyžadovaly jakékoli změny hardwaru nebo softwaru.

Dějiny

Pozadí

Die-stacked memory was původně komercializována v průmyslu flash pamětí . Toshiba představila NAND flash paměťový čip s osmi skládanými matricemi v dubnu 2007, poté Hynix Semiconductor představil NAND flash čip s 24 skládanými matricemi v září 2007.

Technologie 3D-stacked random-access memory (RAM) using through-silicon via (TSV) technology was komercializovaná společností Elpida Memory , která vyvinula první 8 GB DRAM čip (skládaný se čtyřmi DDR3 SDRAM matricemi) v září 2009, a uvolnil jej v červnu 2011. V roce 2011 představila společnost SK Hynix 16 GB paměti DDR3 ( třída 40 nm ) využívající technologii TSV, společnost Samsung Electronics představila v září 3D skládané 32 GB paměti DDR3 ( třída 30 nm ) založené na TSV a poté společnost Samsung and Micron Technology oznámila TSV- v říjnu založená technologie Hybrid Memory Cube (HMC).       

Společnost JEDEC poprvé vydala v prosinci 2011 po několika letech práce standard JESD229 pro paměť Wide IO, předchůdce HBM se čtyřmi 128bitovými kanály s taktováním jedné rychlosti přenosu dat. V říjnu 2013 následoval první standard HBM JESD235.

Rozvoj

AMD Fiji , první GPU využívající HBM

Vývoj vysokorychlostní paměti začal v AMD v roce 2008, aby vyřešil problém stále se zvyšujícího využití energie a tvarového faktoru počítačové paměti. V průběhu několika příštích let společnost AMD vyvinula postupy pro řešení problémů se stohováním pomocí týmu vedeného seniorním kolegou AMD Bryanem Blackem. Aby AMD pomohlo realizovat jejich vizi HBM, získali partnery z paměťového průmyslu, zejména korejskou společnost SK Hynix , která měla předchozí zkušenosti s 3D skládanou pamětí, a také partnery z interposerového průmyslu (tchajwanská společnost UMC ) a obalového průmyslu ( Amkor Technology a ASE ).

Vývoj HBM byl dokončen v roce 2013, kdy SK Hynix postavil první paměťový čip HBM. HBM byl přijat jako průmyslový standard JESD235 společností JEDEC v říjnu 2013 na základě návrhu společností AMD a SK Hynix v roce 2010. Výroba velkého objemu začala v závodě Hynix v Icheonu v Jižní Koreji v roce 2015.

První GPU využívající HBM byl AMD Fiji, který byl vydán v červnu 2015 a poháněl AMD Radeon R9 Fury X.

V lednu 2016 zahájila společnost Samsung Electronics ranou sériovou výrobu HBM2. Ve stejný měsíc byl HBM2 přijat společností JEDEC jako standardní JESD235a. První GPU čip využívající HBM2 je Nvidia Tesla P100, který byl oficiálně oznámen v dubnu 2016.

V červnu 2016 společnost Intel vydala rodinu procesorů Xeon Phi s 8 zásobníky HCDRAM, Micronova verze HBM. Na Hot Chips v srpnu 2016 Samsung i Hynix oznámili novou generaci paměťových technologií HBM. Obě společnosti oznámily vysoce výkonné produkty, u nichž se očekává zvýšená hustota, větší šířka pásma a nižší spotřeba energie. Samsung také oznámil vývoj levnější verze HBM zaměřené na masové trhy. Odstranění matrice vyrovnávací paměti a snížení počtu TSV snižuje náklady, i když na úkor snížené celkové šířky pásma (200 GB/s).

Viz také

Reference

externí odkazy