Cray-3 - Cray-3

Seymour Cray představuje za nádrží procesoru Cray-3. CPU zabírá pouze horní část nádrže, zbytek obsahuje paměť a napájecí zdroje.

Cray-3 byl vektor superpočítač , Seymour Cray je určený nástupce Cray-2 . Tento systém byl jednou z prvních hlavních aplikací polovodičů arsenidu galia (GaAs) ve výpočetní technice, využívající stovky na zakázku vyrobených integrovaných obvodů zabalených do CPU o velikosti 1 kubické stopy (0,028 m 3 ) . Cílem designu byl výkon kolem 16 GFLOPS , přibližně 12krát větší než u Cray-2.

Práce na Cray-3 byly zahájeny v roce 1988 ve vývojových laboratořích Cray Research (CRI) v Chippewa Falls ve Wisconsinu . Ostatní týmy v laboratoři pracovaly na designech s podobným výkonem. Později téhož roku bylo úsilí Cray-3 přesunuto do nové laboratoře v Colorado Springs v Coloradu, aby se týmy zaměřily . Krátce nato se ředitelství společnosti v Minneapolisu rozhodlo ukončit práce na Cray-3 ve prospěch jiného designu, Cray C90 . V roce 1989 se úsilí Cray-3 odštěpilo od nově založené společnosti Cray Computer Corporation (CCC).

Zahajovací zákazník, Lawrence Livermore National Laboratory , zrušil svou objednávku v roce 1991 a řada vedoucích pracovníků společnosti odešla krátce poté. První stroj byl konečně připraven v roce 1993, ale bez startovacího zákazníka byl místo toho zapůjčen jako demonstrační jednotka do nedalekého Národního centra pro výzkum atmosféry v Boulderu . Společnost zkrachovala v květnu 1995 a stroj byl oficiálně vyřazen z provozu.

S dodáním prvního Cray-3 se Seymour Cray okamžitě přesunul k podobnému, ale vylepšenému designu Cray-4 , ale společnost zkrachovala, než byla úplně otestována. Cray-3 byl Crayův poslední dokončený design; s bankrotem společnosti CCC založil společnost SRC Computers, aby se soustředil na paralelní návrhy, ale zemřel před autonehodou v roce 1996 před dodáním této práce.

Dějiny

Pozadí

Seymour Cray zahájil návrh Cray-3 v roce 1985, jakmile Cray-2 dosáhl výroby. Cray si obecně stanovil za cíl vyrábět nové stroje s desetinásobným výkonem oproti předchozím modelům. Ačkoli stroje ne vždy splňovaly tento cíl, byla to užitečná technika při definování projektu a objasnění toho, jaký druh vylepšení procesu by bylo zapotřebí k jeho splnění. Pro Cray-3 se rozhodl stanovit ještě vyšší cíl zlepšení výkonu, což je 12násobný nárůst oproti Cray-2.

Cray vždy zaútočil na problém zvýšené rychlosti třemi současnými pokroky; více prováděcích jednotek, které systému dodávají vyšší paralelismus , těsnější balení pro snížení zpoždění signálu a rychlejší komponenty, které umožňují vyšší rychlost hodin. Z těch tří byl Cray poslední nejméně normálně agresivní; jeho designy inklinovaly k použití komponent, které již byly široce používány, na rozdíl od špičkových designů.

Pro Cray-2 představil nový 3D obalový systém pro své integrované obvody umožňující vyšší hustoty a zdálo se, že v tomto procesu existuje určitý prostor pro zlepšení. Pro nový design uvedl, že všechny dráty budou omezeny na maximální délku 1 stopy (0,30 m). To by vyžadoval procesor moci, aby se vešly do 1 na krychlovou stopu (0,028 m 3 ) blok, o 1 / 3 , který CPU Cray-2. To by nejen zvýšilo výkon, ale způsobilo by to 27krát menší systém.

Pro 12násobné zvýšení výkonu by samotné balení nestačilo, obvody na samotných čipech by se také musely zrychlit. Zdálo se, že Cray-2 posouvá hranice rychlosti tranzistorů na bázi křemíku na 4,1 ns (244 MHz) a nezdálo se, že by bylo možné něco jiného než další 2x. Pokud by měl být splněn cíl 12x, bylo by zapotřebí radikálnějších změn a musel by být použit „high-tech“ přístup.

Cray měl v úmyslu použít obvody arsenidu gália v Cray-2, které by nejen nabízely mnohem vyšší spínací rychlosti, ale také používaly méně energie, a tak běžely také chladněji. V době, kdy byl Cray-2 navrhován, stav výroby GaAs prostě nebyl na úkolu dodávat superpočítač. V polovině 80. let se věci změnily a Cray se rozhodl, že je to jediná cesta vpřed. Vzhledem k nedostatku investic ze strany velkých výrobců čipů se Cray rozhodl investovat do spuštění výroby čipů GaAs, GigaBit Logic, a použít je jako interního dodavatele.

Při popisu systému v listopadu 1988 Cray uvedl, že 12násobné zvýšení výkonu by bylo tvořeno třikrát zvýšeným kvůli obvodům GaAs a čtyřikrát kvůli použití více procesorů. Jedním z problémů Cray-2 byl špatný multiprocesní výkon kvůli omezené šířce pásma mezi procesory a Cray-3 by k řešení tohoto problému přijal mnohem rychlejší architekturu používanou v Cray Y-MP . To by poskytlo návrhový výkon 8000 MIPS nebo 16 GFLOPS .

Rozvoj

Cray-3 byl původně určen k dodání v roce 1991. To bylo v době, kdy se trh superpočítačů rychle zmenšoval z 50% meziročního růstu v roce 1980 na 10% v roce 1988. Současně Cray Research pracoval také na Y-MP, rychlejší víceprocesorová verze systémové architektury, která sleduje jeho původ před původním Cray-1 . S cílem zaměřit se na skupiny Y-MP a Cray-3 as osobní podporou Cray se projekt Cray-3 přesunul do nového výzkumného centra v Colorado Springs .

V roce 1989 zahájil Y-MP dodávky a hlavní laboratoř CRI v Chippewa Falls ve Wisconsinu přešla na C90, což je další vylepšení řady Y-MP. Když se prodalo pouze 25 Cray-2, vedení se rozhodlo, že Cray-3 by měl být kladen na vývoj s „nízkou prioritou“. V listopadu 1988 byla laboratoř Colorado Springs vyčleněna jako Cray Computer Corporation (CCC), přičemž CRI si ponechala 10% akcií nové společnosti a poskytla směnku 85 milionů dolarů na financování rozvoje. Cray sám nebyl akcionářem nové společnosti a pracoval na základě smlouvy. Vzhledem k tomu, že si CRI ponechala nájem v původní budově, musela se nová společnost znovu přestěhovat, což způsobilo další zpoždění.

Do roku 1991 byl vývoj pozadu. Vývoj se zpomalil ještě více, když národní laboratoř Lawrence Livermore zrušila objednávku prvního stroje ve prospěch C90. Několik vedoucích pracovníků, včetně generálního ředitele, společnost opustilo. Společnost poté oznámila, že bude hledat zákazníka, který potřebuje menší verzi stroje se čtyřmi až osmi procesory.

První (a jediný) produkční model (sériové číslo S5, pojmenovaný Graywolf ) byl zapůjčen NCAR jako demonstrační systém v květnu 1993. Verze NCAR byla nakonfigurována se 4 procesory a 128 MWord (64bitová slova, 1 GB) společná paměť . V provozu se statická RAM ukázala jako problematická. Bylo také zjištěno, že kód druhé odmocniny obsahoval chybu, která vedla k chybnému výpočtu 1 z 60 milionů. Jeden ze čtyř procesorů navíc nefungoval spolehlivě.

Společnost CCC vyhlásila bankrot v březnu 1995 poté, co utratila přibližně 300 milionů dolarů z financování. Stroj NCAR byl oficiálně vyřazen z provozu následující den. Pro stroje Cray-3 bylo vyrobeno sedm systémových skříní neboli „tanků“, sériových čísel S1 až S7. Většina byla pro menší stroje s dvěma CPU. Tři z menších tanků byly použity na projektu Cray-4 , v podstatě Cray-3 se 64 rychlejšími procesory běžícími na 1 ns (1 GHz) a zabalené do ještě menšího prostoru. Další byl použit pro projekt Cray-3 / SSS .

Selhání Cray-3 bylo z velké části způsobeno měnícím se politickým a technickým prostředím. Stroj byl navržen během zhroucení Varšavské smlouvy a konce studené války , což vedlo k masivnímu zmenšení nákupů superpočítačů. Současně trh stále více investoval do masivně paralelních (MP nebo MPP) návrhů. Cray byl kritický vůči tomuto přístupu a byl citován The Wall Street Journal, když uvedl, že systémy MPP ještě neprokázaly svoji nadřazenost nad vektorovými počítači, a upozorňuje na potíže, které mnoho uživatelů muselo programovat pro velké paralelní stroje. „Nemyslím si, že budou někdy všeobecně úspěšní, alespoň ne za mého života“.

Architektura

Logický design

Architektura systému Cray-3 zahrnovala systém zpracování popředí , až 16 procesorů na pozadí a až 2 gigawords (16 GB) společné paměti . Systém v popředí byl věnován vstupu / výstupu a správě systému. Zahrnoval 32bitový procesor a čtyři synchronní datové kanály pro velkokapacitní úložiště a síťová zařízení, primárně prostřednictvím kanálů HiPPI .

Každý procesor na pozadí sestával z výpočetní sekce , řídicí sekce a lokální paměti . Sekce výpočtu prováděla 64bitovou skalární, plovoucí desetinnou čárku a vektorovou aritmetiku . Řídicí část poskytovala vyrovnávací paměti instrukcí, funkce správy paměti a hodiny v reálném čase . 16 kwordů (128 kbytů) vysokorychlostní místní paměti bylo začleněno do každého procesoru na pozadí pro použití jako dočasná pomocná paměť.

Společnou paměť tvořil křemíkový CMOS SRAM , uspořádaný do oktantů po 64 bankách, přičemž je možné až osm oktantů. Velikost slova byla 64 bitů plus osm bitů pro opravu chyb a celková šířka pásma paměti byla hodnocena na 128 gigabajtů za sekundu.

Návrh CPU

Typické rozložení modulů s uspořádáním 4x4 „submodulů“, naskládaných do hloubky 4. Kovové konektory na spodní straně jsou napájecí přípojky.

Stejně jako u předchozích návrhů, jádro Cray-3 sestávalo z řady modulů , z nichž každý obsahoval několik desek plošných spojů nabitých částmi. Aby se zvýšila hustota, jednotlivé čipy GaAs nebyly zabaleny a místo toho bylo několik namontováno přímo pomocí ultrazvukového zlatého lepení na desku přibližně 1 palec (25 mm) čtverec. Desky byly poté otočeny a spojeny s druhou deskou nesoucí elektrické vedení, přičemž dráty na této kartě procházely otvory na „spodní“ stranu (naproti čipům) straně nosiče čipů, kde byly spojeny, a tudíž sevřel čip mezi dvě vrstvy desky. Tyto dílčí moduly byly poté naskládány do čtyř hloubek a stejně jako v Cray-2 byly navzájem propojeny, aby vytvořily 3D obvod.

Na rozdíl od Cray-2 zahrnovaly moduly Cray-3 také hranové konektory . Šestnáct takových submodulů bylo spojeno dohromady v poli 4 × 4, aby vznikl jediný modul o rozměrech 121 x 107 krát 7 milimetrů (4,76 palce × 4,21 palce × 0,28 palce). I při tomto pokročilém balení byla hustota obvodů nízká dokonce i podle standardů 90. let, přibližně 96 000 bran na kubický palec. Moderní CPU nabízejí počet bran v milionech na čtvereční palec a přechod na 3D obvody se od roku 2017 stále ještě zvažuje.

Třicet dva takových modulů bylo poté naskládáno a propojeno hromadou vodičů kroucené dvojlinky do jediného procesoru. Základní doba cyklu byla 2,11 ns neboli 474 MHz, což umožnilo každému procesoru dosáhnout přibližně 0,948 GFLOPS a 16 procesorový stroj teoretický 15,17 GFLOP. Klíčem k vysokému výkonu byl vysokorychlostní přístup k hlavní paměti, který umožňoval každému procesu prasknout až 8 GB / s.

Mechanické provedení

Kompletní "cihla" procesoru. Moduly jsou viditelné uvnitř a jsou namontovány svisle.

Moduly byly drženy pohromadě v hliníkovém šasi známém jako „cihla“. Cihly byly ponořeny do kapalného fluorinertu pro chlazení, jako v Cray-2. Čtyřprocesorový systém se 64 paměťovými moduly rozptýlil výkon přibližně 88 kW. Celý systém se čtyřmi procesory byl asi 20 palců (510 mm) vysoký a zepředu dozadu a něco málo přes 2 stopy (0,61 m) široký.

U systémů s až čtyřmi procesory seděla sestava procesorů pod průsvitným bronzovým akrylovým krytem v horní části skříně široké 42 palců (1,1 m), hluboké 28 palců (0,71 m) a vysoké 50 palců (1,3 m), přičemž paměť pod ním a poté napájecí zdroje a chladicí systémy ve spodní části. Systém osmi a 16 procesorů by byl umístěn ve větší osmiboké skříni. Celkově vzato byl Cray-3 podstatně menší než Cray-2, sám o sobě relativně malý ve srovnání s jinými superpočítači.

Kromě systémové skříně potřeboval systém Cray-3 také jeden nebo dva (v závislosti na počtu procesorů) ovládací podstavce systému (neboli „C-Pods“), čtverec 52,5 palce (1,33 m) a 55,3 palce (1,40 m) vysoká, obsahující zařízení pro řízení výkonu a chlazení.

Konfigurace systému

Byly oficiálně specifikovány následující možné konfigurace Cray-3:

název CPU Paměť (Mwords) I / O moduly
Cray-3 / 1-256 1 256 1
Cray-3 / 2-256 2 256 1
Cray-3 / 4-512 4 512 3
Cray-3 / 4-1024 4 1024 3
Cray-3 / 4-2048 4 2048 3
Cray-3 / 8-1024 8 1024 7
Cray-3 / 8-2048 8 2048 7
Cray-3 / 16-2048 16 2048 15

Software

Cray-3 provozoval operační systém Colorado Springs ( CSOS ), který byl založen na operačním systému UNICOS Cray Research verze 5.0. Hlavní rozdíl mezi CSOS a UNICOS byl v tom, že CSOS byl portován na standardní C se všemi příponami PCC, které byly použity v UNICOS, odstraněny.

Velká část softwaru dostupného pod Cray-3 byla odvozena od Cray Research a zahrnovala například X Window System , vektorizující kompilátory FORTRAN a C , NFS a zásobník TCP / IP .

Reference

Citace

Bibliografie

externí odkazy