Nvidia Tesla - Nvidia Tesla

Nvidia Tesla
GPU Nvidia Tesla
Výrobce Nvidia
Představeno 2. května 2007 ;
Před 14 lety
 ( 2007-05-02 )
Typ Spotřebitelské grafické karty

Nvidia Tesla byl název řady produktů Nvidia zaměřených na streamové zpracování nebo jednotky pro obecné zpracování grafiky (GPGPU), pojmenované podle průkopnického elektrotechnika Nikoly Tesly . Její produkty začaly používat GPU ze série G80 a nadále doprovázely vydání nových čipů. Jsou programovatelné pomocí API CUDA nebo OpenCL .

Produktová řada Nvidia Tesla konkurovala řadám hlubokého učení a grafickým kartám AMD Radeon Instinct a Intel Xeon Phi .

Společnost Nvidia v květnu 2020 ukončila provoz značky Tesla, údajně kvůli možnému záměně se značkou automobilů . Jeho nové GPU jsou značkové GPU Nvidia Data Center , jako v GPU Ampere A100.

Přehled

Nvidia Tesla C2075

Produkty Tesla, které nabízejí výpočetní výkon mnohem větší než tradiční mikroprocesory , se zaměřily na trh vysoce výkonných počítačů . Od roku 2012, Nvidia Tesla síla některé z nejrychlejších světových superpočítačů , včetně summitu v Oak Ridge National Laboratory a Tianhe-1A , v Tianjin , Čína .

Karty Tesla mají čtyřnásobek výkonu s dvojnásobnou přesností než karta Nvidia GeForce na bázi Fermi s podobným výkonem s jednoduchou přesností. Na rozdíl od spotřebitelských karet GeForce společnosti Nvidia a profesionálních karet Nvidia Quadro karty Tesla původně nemohly přenášet obrázky na displej . Poslední produkty třídy Tesla C však obsahovaly jeden port DVI Dual-Link.

V rámci projektu Denver hodlá Nvidia do svých GPU vložit jádra procesorů ARMv8. Půjde o 64bitové pokračování 32bitových čipů Tegra .

Tesla P100 používá TSMC je 16 nanometrů FinFET polovodičové výrobní proces , který je pokročilejší než 28 nanometrů procesu dříve používaný AMD a Nvidia GPU mezi 2012 a 2016. P100 také používá Samsung je HBM2 paměti.

Aplikace

Produkty Tesla se používají především v simulacích a ve velkých výpočtech (zejména s výpočty s plovoucí desetinnou čárkou) a pro generování špičkových obrazů pro profesionální a vědecké obory.

V roce 2013 představoval obranný průmysl necelou šestinu prodejů společnosti Tesla, ale společnost Sumit Gupta předpovídala zvýšení prodeje na trhu geoprostorových zpravodajských služeb .

Specifikace

Modelka mikro-
architektura
Zahájení Bramborové hranolky Takt jádra
( MHz )
Shadery Paměť Procesní výkon ( GFLOPS )
Výpočetní
schopnost CUDA
TDP
(watty)
Poznámky, form_factor
Cuda jádra
(celkem)
Základní hodiny ( MHz ) Maximální boostovací frekvence
( MHz )
Typ autobusu Šířka sběrnice
( bit )
Velikost
( GB )
Hodiny
( MT/s )
Šířka pásma
( GB /s)
Jednoduchá přesnost
(MAD+MUL)
Jednoduchá přesnost
(MAD nebo FMA )
Dvojitá přesnost
( FMA )
Jednotky MHz MHz W
Výpočetní modul GPU C870 Tesla 2. května 2007 1 × G80 600 128 1350 N/A GDDR3 384 1.5 1600 76,8 518,4 345,6 Ne 1,0 170,9 Interní PCIe GPU (plná výška, duální slot)
Stolní počítač D870 2. května 2007 2 × G80 600 256 1350 N/A GDDR3 2 × 384 2 × 1,5 1600 2 × 76,8 1036,8 691,2 Ne 1,0 520 Externí GPU pro montáž na stůl nebo 3U do racku
Výpočetní server GPU S870 2. května 2007 4 × G80 600 512 1350 N/A GDDR3 4 × 384 4 × 1,5 1600 4 × 76,8 2073,6 1382,4 Ne 1,0 1U externí GPU pro montáž do racku , připojení přes 2 × PCIe (× 16)
Výpočetní modul GPU C1060 09.04.09 1 × GT200 602 240 1296 N/A GDDR3 512 4 1600 102,4 933.12 622,08 77,76 1.3 187,8 Interní PCIe GPU (plná výška, duální slot)
S1070 GPU Computing Server „400 konfigurace“ 1. června 2008 4 × GT200 602 960 1296 N/A GDDR3 4 × 512 4 × 4 1538,4 4 × 98,5 3732,5 2488,3 311,0 1.3 800 1U externí GPU pro montáž do racku , připojení přes 2 × PCIe (× 8 nebo × 16)
S1070 GPU Computing Server „500 konfigurace“ 1440 N/A 4147,2 2764,8 345,6
Výpočetní server GPU S1075 1. června 2008 4 × GT200 602 960 1440 N/A GDDR3 4 × 512 4 × 4 1538,4 4 × 98,5 4147,2 2764,8 345,6 1.3 1U externí GPU pro montáž do racku , připojení přes 1 × PCIe (× 8 nebo × 16)
Vizuální výpočetní systém Quadro Plex 2200 D2 2 × GT200GL 648 480 1296 N/A GDDR3 2 × 512 2 × 4 1600 2 × 102,4 1866.2 1244,2 155,5 1.3 Stolní nebo 3U externí GPU pro montáž do racku se 4 dual-link DVI výstupy
Vizuální výpočetní systém Quadro Plex 2200 S4 4 × GT200GL 648 960 1296 N/A GDDR3 4 × 512 4 × 4 1600 4 × 102,4 3732,5 2488,3 311,0 1.3 1200 1U externí GPU pro montáž do racku , připojení přes 2 × PCIe (× 8 nebo × 16)
Výpočetní modul GPU C2050 Fermi 25. července 2011 1 × GF100 575 448 1150 N/A GDDR5 384 3 3000 144 Ne 1030,4 515,2 2.0 247 Interní PCIe GPU (plná výška, duální slot)
Výpočetní modul GPU M2050 25. července 2011 N/A 3092 148,4 Ne 225
Výpočetní modul GPU C2070 25. července 2011 1 × GF100 575 448 1150 N/A GDDR5 384 6 3000 144 Ne 1030,4 515,2 2.0 247 Interní PCIe GPU (plná výška, duální slot)
Výpočetní modul GPU C2075 25. července 2011 N/A 3000 144 Ne 225
Výpočetní modul GPU M2070/M2070Q 25. července 2011 N/A 3132 150,336 Ne 225
Výpočetní modul GPU M2090 25. července 2011 1 × GF110 650 512 1300 N/A GDDR5 384 6 3700 177,6 Ne 1331,2 665,6 2.0 225 Interní PCIe GPU (plná výška, duální slot)
Výpočetní server GPU S2050 25. července 2011 4 × GF100 575 1792 1150 N/A GDDR5 4 × 384 4 × 3 3 4 × 148,4 Ne 4121,6 2060,8 2.0 900 1U externí GPU pro montáž do racku , připojení přes 2 × PCIe (× 8 nebo × 16)
Výpočetní server GPU S2070 N/A 4 × 6 Ne
Akcelerátor GPU K10 Kepler 1. května 2012 2 × GK104 N/A 3072 745 ? GDDR5 2 × 256 2 × 4 5 000 2 × 160 Ne 4577 190,7 3,0 225 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU K20 12. listopadu 2012 1 × GK110 N/A 2496 706 758 GDDR5 320 5 5200 208 Ne 3524 1175 3.5 225 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU K20X 12. listopadu 2012 1 × GK110 N/A 2688 732 ? GDDR5 384 6 5200 250 Ne 3935 1312 3.5 235 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU K40 8. října 2013 1 × GK110B N/A 2880 745 875 GDDR5 384 12 6000 288 Ne 4291–5040 1430–1680 3.5 235 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU K80 17. listopadu 2014 2 × GK210 N/A 4992 560 875 GDDR5 2 × 384 2 × 12 5 000 2 × 240 Ne 5591–8736 1864–2912 3.7 300 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU M4 Maxwell 10. listopadu 2015 1 × GM206 N/A 1024 872 1072 GDDR5 128 4 5500 88 Ne 1786–2195 55,81–68,61 5.2 50–75 Interní PCIe GPU (poloviční výška, jeden slot)
Akcelerátor GPU M6 30. srpna 2015 1 × GM204-995-A1 N/A 1536 722 1051 GDDR5 256 8 4600 147,2 Ne 2218–3229 69,3–100,9 5.2 75–100 Interní MXM GPU
Akcelerátor GPU M10 4 × GM107 N/A 2560 1033 ? GDDR5 4 × 128 4 × 8 5188 4 × 83 Ne 5289 165,3 5.2 225 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU M40 10. listopadu 2015 1 × GM200 N/A 3072 948 1114 GDDR5 384 12 6000 288 Ne 5825–6844 182,0–213,9 5.2 250 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU M60 30. srpna 2015 2 × GM204-895-A1 N/A 4096 899 1178 GDDR5 2 × 256 2 × 8 5 000 2 × 160 Ne 7365–9650 230,1–301,6 5.2 225–300 Interní PCIe GPU (plná výška, duální slot)
Akcelerátor GPU P4 Pascal 13. září 2016 1 × GP104 N/A 2560 810 1063 GDDR5 256 8 6000 192,0 Ne 4147–5443 129,6–170,1 6.1 50-75 Karta PCIe
Akcelerátor GPU P6 24. března 2017 1 × GP104-995-A1 N/A 2048 1012 1506 GDDR5 256 16 3003 192,2 Ne 6169 192,8 6.1 90 Karta MXM
Akcelerátor GPU P40 13. září 2016 1 × GP102 N/A 3840 1303 1531 GDDR5 384 24 7200 345,6 Ne 10007–11758 312,7–367,4 6.1 250 Karta PCIe
P100 akcelerátor GPU (mezipatro) 5. dubna 2016 1 × GP100-890-A1 N/A 3584 1328 1480 HBM2 4096 16 1430 732 Ne 9519–10609 4760–5304 6.0 300 Karta NVLink
Akcelerátor GPU P100 (karta 16 GB) 20. června 2016 1 × GP100 N/A 1126 1303 Ne 8071‒9340 4036-4670 250 Karta PCIe
Akcelerátor GPU P100 (karta 12 GB) 20. června 2016 N/A 3072 12 549 Ne 8071‒9340 4036-4670
V100 GPU akcelerátor (mezipatro) Volta 1 × GV100-895-A1 N/A 5120 Neznámý 1455 HBM2 4096 16 nebo 32 1750 900 Ne 14899 7450 7.0 300 Karta NVlink
V100 GPU akcelerátor (karta PCIe) 21. června 2017 1 × GV100 N/A Neznámý 1370 Ne 14028 7014 250 Karta PCIe
V100 GPU akcelerátor (karta PCIe FHHL) 27. března 2018 1 × GV100 N/A 937 1290 16 1620 829,44 Ne 13210 6605 250 Karta PCIe FHHL
Akcelerátor GPU T4 (karta PCIe) Turing 12. září 2018 1 × TU104-895-A1 N/A 2560 585 1590 GDDR6 256 16 Neznámý 320 Ne 8100 Neznámý 7.5 70 Karta PCIe
A10 GPU akcelerátor (karta PCIe) Ampér 12. dubna 2021 1 × GA102-890-A1 N/A 9216 885 1695 GDDR6 384 24 Neznámý 600 Ne 31240 976 8.6 150 Karta PCIe (jeden slot)
A16 GPU akcelerátor (karta PCIe) 12. dubna 2021 4 × GA107 N/A 10240 885 1695 GDDR6 4x 128 4x 16 Neznámý 4x 231,9 Ne 34712 1084,8 8.6 250 Karta PCIe (duální slot)
A30 GPU accelerator (PCIe card) 12. dubna 2021 1 × GA100 N/A 3584 930 1440 HBM2 3072 24 Neznámý 933,1 Ne 10320 5161 8,0 165 Karta PCIe (duální slot)
A40 GPU akcelerátor (karta PCIe) 5. října 2020 1 × GA102 N/A 10752 1305 1740 GDDR6 384 48 Neznámý 695,8 Ne 37420 1168 8.6 300 Karta PCIe (duální slot)
Akcelerátor GPU A100 (karta PCIe) 14. května 2020 1 × GA100-883AA-A1 N/A 6912 765 1410 HBM2 5120 40 Neznámý 1555 Ne 19500 9700 8,0 250 Karta PCIe
Modelka mikro-
architektura
Zahájení Bramborové hranolky Takt jádra
( MHz )
Shadery Paměť Procesní výkon ( GFLOPS )
Výpočetní
schopnost CUDA
TDP
(watty)
Poznámky, form factor
Cuda jádra
(celkem)
Základní hodiny ( MHz ) Maximální boostovací frekvence
( MHz )
Typ autobusu Šířka sběrnice
( bit )
Velikost
( GB )
Hodiny
( MT/s )
Šířka pásma
(celkem)
( GB /s)
Jednoduchá přesnost
(MAD+MUL)
Jednoduchá přesnost
(MAD nebo FMA )
Dvojitá přesnost
( FMA )

Poznámky

Viz také

Reference

externí odkazy