grafické zpracování jednotka - Graphics processing unit


z Wikipedie, otevřené encyklopedie
Součásti GPU

Grafického procesoru ( GPU ) je specializovaný elektronický obvod navržen tak, aby rychle manipulovat a měnit paměti pro urychlení vytváření obrazů v rámcové vyrovnávací paměti určené pro výstup do zobrazovacího zařízení . GPU jsou použity v oblasti vestavěných systémů , mobilní telefony , osobní počítače , pracovní stanice a herních konzolí . Moderní GPU jsou při manipulaci s velmi efektivní počítačové grafiky a zpracování obrazu . Jejich vysoce paralelní struktura činí účinnější než univerzální CPU pro algoritmy , které zpracovávají velké bloky dat paralelně. V osobním počítači, může být přítomen na GPU grafickou kartu nebo integrovaný na základní desce . V některých procesorů, které jsou uloženy na procesoru umřít .

Termín GPU byl používán od přinejmenším 1980, ale byl propagován Nvidia v roce 1999, který se na trh s GeForce 256 jako „první na světě GPU“. To byl prezentován jako „jednočipový procesor s integrované transformace, osvětlení, trojúhelník nastavení / ořezávání a vykreslování motory“. Rival ATI Technologies razil termín „ vizuální zpracování jednotka “ nebo VPU s vydáním Radeon 9700 v roce 2002.

Dějiny

1970

Arkády systémové desky byly pomocí specializované grafické čipy od roku 1970. Na začátku videohry hardware je paměť RAM pro snímkových vyrovnávacích pamětí bylo drahé, tak video čipy složené dat společně jako displej byl skenován se na monitoru.

Fujitsu je MB14241 Video posunovač byl použit k urychlení čerpání skřítek grafiky pro nejrůznější 1970 arkádové hry od Taito a Midway , jako jsou pistole Fight (1975), Sea Wolfa (1976) a Space Invaders (1978). Namco Galaxian pasáž systém v roce 1979 použit specializovaný grafický hardware podporující barev RGB , vícebarevné skřítky a tilemap pozadí. Hardware Galaxian byl široce používán během zlatého věku arkádových videoher , od herních společností, jako Namco , Centuri , Gremlin , Irem , Konami , Midway , Nichibutsu , Sega a Taito .

Na domácím trhu, Atari 2600 v roce 1977 použito video posunovač nazývá Television Interface Adapter . Na Atari 8-bitové počítače (1979) měla Antić , video procesor, který vykládáno pokyny popisující „seznam zobrazení“ -The způsobem mapovat skenování linky na konkrétní rastrové nebo znakové režimy a kde je paměť uložena (takže nepotřebovala být souvislý rám vyrovnávací paměti). 6502 Strojový kód podprogramy by mohla být spuštěna na řádků skenování nastavením bit instrukcemi seznamu zobrazení. ANTIC také podporoval hladkou vertikální a horizontální rolování nezávisle na CPU.

1980

NEC μPD7220 byl jedním z prvních implementací řadiče grafickém displeji jako jediný vysoký stupeň integrace (LSI) integrovaného obvodu čipu, což umožňuje konstrukci low-cost, vysoce výkonných videa grafické karty, jako jsou ty od Number Nine Visual Technology . To se stalo jedním z nejznámějších, co byl známý jako grafické zpracování jednotek v roce 1980.

Williams Elektronické arkádové hry Robotron 2084 , Klání , Sinistar a Bubbles , všechny vydané v roce 1982, obsahují vlastní Blitter čipy pro provoz na 16-ti barevné bitmapy.

V roce 1985, Commodore Amiga představovala zakázkové grafický čip s Blitter jednotky zrychlujícího bitmapové manipulaci, linka draw a prostor naplnit funkcí. Součástí je také koprocesor (běžně označované jako „měď“) s vlastním primitivní instrukční sady, které jsou schopné manipulovat s grafickým hardwarem registry v synchronizaci s grafickým paprsku (například pro per-scanline palety spínače, sprite multiplexování a hardware okénkováním) nebo řidičský blitter.

V roce 1986, Texas Instruments vydala tms34010 , první mikroprocesor s on-chip grafických schopností. To by mohlo spustit univerzálního kódu, ale to mělo velmi graficky orientovaných instrukční sadu. V letech 1990-1992, tento čip by se stal základem Texas Instruments Graphics Architecture ( „Tiga“) Windows akceleračních karet.

V roce 1987, IBM 8514 grafický systém byl propuštěn jako jedna z prvních grafických karet pro IBM PC kompatibilní zavést pevnou funkční 2D primitiva v elektronickém hardwaru . Ve stejném roce, Sharp uvolnil Sharp X68000 , který používal zakázkový grafický chipset, který byl silný pro domácího počítače v té době, s paletou a hardwarovou podporou 65536 barev pro skřítky, rolování a více playfields, případně slouží jako vývojové stroj pro Capcom ‚s CP System pasáž board. Fujitsu později soutěžil s FM měst počítače, které vyšlo v roce 1989 s podporou pro plné palety 16.777.216 barev.

V roce 1988, první dedikované polygonální 3D grafické karty byly představeny v pasážích s Namco System 21 a Taito vzduchu.

1990s

Voodoo3 2000 AGP karet

V roce 1991, S3 Graphics představila S3 86C911 , který konstruktéři pojmenovanou po Porsche 911 jako údaj o výkonu zvýší to slíbil. 86C911 plodil hostitele napodobitelů: v roce 1995, všechny hlavní počítačové grafiky čipů přidal 2D podporu akcelerace na svých žetonů. Do této doby, pevné funkce Windows urychlovače předčil drahé univerzálních grafické koprocesory ve výkonu systému Windows a tyto koprocesory vytratil z trhu PC.

Skrz 1990, 2D GUI zrychlení i nadále vyvíjet. Jak zlepšit výrobní možnosti, stejně tak stupeň integrace grafických čipů. Doplňkové rozhraní pro programování aplikací (API) přijel na řadu úkolů, jako je například Microsoft křídlo grafickou knihovnu pro Windows 3.x , a jejich pozdnější DirectDraw rozhraní pro hardwarové akcelerace 2D her uvnitř Windows 95 a novější.

V počátečních fázích jejich existence a střední-1990, real-time 3D grafiky byly čím dál tím běžnější v pasáži, počítačových a konzolových her, které vedly k rostoucí poptávky veřejnosti po hardwarově akcelerované 3D grafiky . Časné příklady masový trh 3D grafický hardware lze nalézt v podloubí systémových desek, jako jsou Sega Model 1 , Namco System 22 a Sega Model 2 , a páté generace herních konzolí jako je Saturn , PlayStation a Nintendo 64 . Arkády systémy, jako Sega Model 2 a Namco magie hran Hornet simulátor v roce 1993 byly schopné hardware T & L ( transformace, ořezové a osvětlení ), před lety objevil ve spotřebitelských grafických karet. Některé systémy používají DSP pro urychlení transformace. Fujitsu, který pracoval na arkádové systému Sega Model 2, začal pracovat na integraci T & L do jediného LSI řešení pro použití v domácích počítačích v roce 1995; Fujitsu Pinolite, první 3D geometrie procesor pro osobní počítače, které vyšlo v roce 1997. První hardware T & L GPU na domácí herní konzole bylo Nintendo 64 je realita koprocesor , které vyšlo v roce 1996. V roce 1997, Mitsubishi vydala 3Dpro / 2MP , plně vybavený GPU schopný transformace a osvětlení, pro pracovní stanice a Windows NT počítačích; ATi jej využil pro svou FireGL 4000 grafickou kartu , který byl zveřejněn v roce 1997.

Ve světě PC, pozoruhodný selhal nejprve pokusí o low-cost 3D grafických čipů byly S3 Virge , ATI Rage a Matrox Mystique . Tyto čipy byly v podstatě předchozí generace 2D akcelerátory s 3D prvky přišroubovány. Mnozí z nich byli dokonce pin-kompatibilní s dřívější generace čipů pro snadnou implementaci a minimálními náklady. Zpočátku výkon 3D grafiky byly možné pouze s diskrétními desek určených pro akceleraci 3D funkcí (a chybí 2D GUI akcelerace úplně), jako je PowerVR a 3dfx Voodoo . Nicméně, jak technologie výroby i nadále rozvíjet, videa, 2D GUI akcelerace a 3D funkce byly integrovány do jediného čipu. Ztvárnění je Verite čipové sady byly mezi prvními, kteří to natolik dobře, že stojí za zmínku dělat. V roce 1997, Rendition šel ještě o krok dále tím, že spolupracuje s Hercules a Fujitsu na projektu „Thriller Conspiracy“, což v kombinaci s geometrií procesoru Fujitsu FXG 1 Pinolite s jádrem Vérité V2200 vytvořit grafickou kartu s plnou T & L motor let před Nvidia GeForce 256. Tato karta, jejichž cílem je snížit zatížení umístěn na procesoru systému, nikdy udělal to trhu.

OpenGL se objevily na začátku 90. let jako profesionální grafické API, ale původně trpěl výkonnostních problémů, které dovolily Glide API vystoupit a stát se dominantní silou na PC v pozdních 90. let. Nicméně, tyto problémy byly rychle překonány a Glide API klesl na vedlejší koleji. Softwarové implementace OpenGL byly obyčejné během této doby, i když vliv OpenGL nakonec vedlo k široké podpoře hardwaru. V průběhu doby, paritní objevily mezi funkcí nabízených v oblasti hardware a ty nabízené v OpenGL. DirectX stal se populární mezi Windows herní vývojáři během pozdních 90. let. Na rozdíl od OpenGL, Microsoft trval na poskytnutí podpory přísný one-to-one hardwaru. Tento přístup také DirectX méně populární jako samostatný grafický zpočátku API, protože mnoho GPU poskytuje své specifické vlastnosti, které existující aplikace OpenGL již byly schopny využívat, takže často jednu generaci pozadu DirectX. (Viz: Srovnání OpenGL a Direct3D .)

V průběhu doby, Microsoft začala těsněji spolupracovat s vývojáři hardwaru a začala zaměřit se na zprávy rozhraní DirectX, že se shoduje s těmi nosné grafický hardware. Direct3D 5.0 byla první verze narůstající API získat široké přijetí v herním trhu, a to soutěžilo přímo s mnoha dalšími-hardware specifické, často proprietárních grafických knihoven, zatímco OpenGL udržuje silné pokračování. Direct3D 7.0 zavádí podporu pro hardwarové zrychlení transformace a osvětlení (T-L) pro Direct3D, zatímco OpenGL měla tato funkce již vystavena od svého vzniku. 3D akcelerátor karty přesunuty dál být jen jednoduché rasterizers přidat další významnou etapu hardware do renderovacích pipeline 3D. Nvidia GeForce 256 (také známý jako NV10) byla první spotřebitel-level karta vydána na trhu s hardwarově akcelerované T & L, zatímco profesionální 3D karty už tuto schopnost. Hardware Transform and Lighting, oba již existující funkce OpenGL, přišel k spotřebitele na úrovni hardwaru v 90. letech a vytvořil precedens pro pozdější pixel shader a vertex shader jednotek, které byly mnohem flexibilnější a programovatelné.

2000-2010

Nvidia byl nejprve vyrobit čip schopný programovatelného zastínění , tím GeForce 3 (s kódovým označením NV20). Každý pixel nyní mohl být zpracován krátkým „program“, které by mohly zahrnovat další obrazové struktury jako vstupy, a každý geometrický vrchol by rovněž mohl být zpracován krátkým programem před tím, než byl promítán na obrazovku. Používá se v Xbox konzole, soutěžila s PlayStation 2 (který používal vlastní vektor DSP pro hardwarově akcelerované zpracování vrcholů; běžně označované VU0 / VU1). Nejčasnější inkarnace exekučního shader motorů používaných v Xbox nebyly všeobecné účely a nelze spustit libovolný kód pixelu. Vrcholy a pixely byly zpracovány prostřednictvím různých jednotek, které měly své vlastní zdroje s pixel shadery mají mnohem přísnější omezení (což je, jak jsou provedeny na mnohem vyšších frekvencích než u vrcholů). Pixel stínování motory byly vlastně více podobá vysoce přizpůsobitelné funkčního bloku a ne ve skutečnosti „spustit“ program. Mnohé z těchto rozdílů mezi vertex a pixel stínování by neměly být řešeny až mnohem později se Unified Shader Model .

Od října 2002, se zavedením ATI Radeon 9700 (také známý jako R300), nejprve Direct3D 9.0 akcelerátor, pixel a vertex shadery světoví mohly provádět opakování a zdlouhavé s plovoucí desetinnou čárkou math, a byl rychle stává flexibilní jako procesory, přesto objednávek magnitudy rychlejší operace image-array. Pixel stínování je často používán pro bump mapping , který přidává texturu, aby se objekt vypadat lesklý, matný, drsný, ani kulaté nebo extrudovaný.

Se zavedením řady GeForce 8 , který byl produkován Nvidia, a pak nový obecný zpracování toků jednotka GPU stal obecnější výpočetní zařízení. Dnes paralelní GPU začaly dělat výpočetní nájezdy proti procesoru a subfield výzkumu, dabovaný GPU Computing nebo GPGPU pro General Purpose computing na GPU , si našla cestu do polí jak různorodý jak strojového učení , ropy průzkum , vědecké zpracování obrazu , lineární algebra , statistika , 3D rekonstrukce a dokonce akciové opce stanovení cenu. GPGPU v době, kdy byla předzvěst toho, co dnes nazýváme výpočetní shadery (např CUDA, OpenCL, DirectCompute) a skutečně zneužil hardware do té míry, že se na údaje předávané algoritmů jako textur a realizaci algoritmů tím, že kreslí trojúhelník nebo čtyřkolky s vhodný pixel shader. To samozřejmě vyžaduje určité režijní náklady, protože jsme zahrnují jednotky, jako je konvertor Scan , pokud nejsou opravdu potřeba (ani se ještě starat o trojúhelníky, s výjimkou vyvolat pixel shader). V průběhu let se spotřeba energie GPU zvýšil a jeho správě, bylo navrženo několik technik.

NVIDIA CUDA platformou, poprvé představen v roce 2007, byl nejdříve široce přijala programovací model pro GPU computing. Nověji OpenCL stala široce podporován. OpenCL je otevřený standard definovaný Khronos Group, která umožňuje rozvoj kódu pro obě GPU a CPU s důrazem na přenositelnost. OpenCL řešení jsou podporovány Intel, AMD, Nvidia a ARM, a podle nedávné zprávy Evan data, OpenCL je vývoj GPGPU platformou nejčastěji používají vývojáři v USA i Asii a Tichomoří.

2010 předložit

V roce 2010, Nvidia začal partnerství s Audi pohánět panelů svých autech. Tyto Tegra GPU byly napájení dashboard, které nabízejí zvýšenou funkčnost pro automobily těchto vozů navigace a zábavní systémy. Pokrok v GPU technologie v automobilech pomohl tlačit samostatné hnací technologii . AMD řady Radeon HD 6000 karty byl propuštěn v roce 2010 a v roce 2011, AMD povolený jejich 6000M Series diskrétní GPU pro použití v mobilních zařízeních. Kepler řada grafických karet Nvidia vyšel v roce 2012 a byly použity v sérii karet Nvidia je 600 až 700. Novinkou v tomto novém GPU mikroarchitektury zahrnuty GPU Boost, technologie nastavuje hodiny-rychlost grafické karty pro zvýšení nebo snížení je v souladu s jeho příkonu. Kepler mikroarchitektury byl vyroben na proces na 28 nm.

PS4 a Xbox Jeden byl propuštěn v roce 2013, oba používají GPU založené na AMD Radeon HD 7850 a 7790. Nvidia Kepler linii GPU bylo následováno Maxwell linie, vyrobené ve stejném procesu. 28 nm čipy NVIDIA byly vyrobeny TSMC, Taiwan Semiconductor Manufacturing Company, která byla výrobní použití procesu na 28 nm v té době. Ve srovnání s technologií 40 nm z minulosti, tento nový výrobní proces umožnil 20procentní nárůst výkonu při kreslení méně energie. Virtuální realita sluchátka jako je Oculus Rift a HTC Vive mají velmi vysoké požadavky na systém. VR výrobci sluchátka doporučil GTX 970 a R9 290x nebo lépe v době jejich propuštění. Pascal je další generací spotřebitelů grafických karet NVIDIA vydána v roce 2016. The GeForce 10 řady karet jsou v této generaci grafických karet. Jsou vyrobeny s použitím výrobní proces 16 nm, která vylepšuje předchozí microarchitectures. Nvidia vydala jeden non-spotřebitelské karty pod novým Volta architektury, Titan V. Změny od Titan XP, Pascalova high-end karty, patří zvýšení počtu CUDA jader, přičemž přídavek tenzorových jader a vysokou propustnost paměť . Tensorová jádra jsou jádra speciálně určené pro hluboké učení, zatímco paměť s vysokou propustností je on-die, zaplněný, nižší-taktované paměti, který nabízí mimořádně široký paměťovou sběrnici, která je užitečná pro Titan v jeho účelu. Zdůraznit, že Titan V není herní karta Nvidia odstranil „Geforce GTX“ příponu to přidává na spotřebitele hracích karet. Nová generace je RTX Turing GPU byl odhalen 20. srpna 2018, které přidat ray-tracing jádra na GPU, zlepšit jejich výkon na světelné efekty. Polaris 11 a Polaris 10 GPU od AMD jsou vyrobeny proces 14 nanometrů. Jejich zpráva má za následek podstatné zvýšení výkonu na jeden watt AMD grafických karet. AMD také vydala pro své high-end trh Vega GPU, které jsou vybaveny pamětí s velkou šířkou pásma, jako je Titan V.

GPU firmy

GPU výrobci podíl na trhu

Mnoho firem vyrábí GPU pod řadou značek. V roce 2009, Intel , Nvidia a AMD / ATI byli vůdcové podíl na trhu s 49,4%, 27,8% a podíl na trhu 20,6%, resp. Nicméně, tato čísla zahrnují integrované grafické řešení Intel jako GPU. Nepočítaje ty, Nvidia a AMD ovládání téměř 100% podíl na trhu od roku 2018. Jejich příslušné podíly na trhu 66% a 33%. Kromě toho, S3 Graphics a Matrox vyrábět GPU. Moderní smartphony také používají většinou Adreno GPU od společnosti Qualcomm , PowerVR GPU od Imagination Technologies a Mali GPU od ARM .

výpočetní funkce

Moderní GPU používat většinu z jejich tranzistorů provádět výpočty související s 3D počítačové grafiky . Kromě 3D hardwaru, dnešní GPU zahrnují základní 2D akcelerace a framebufferem schopnosti (obvykle s režimu VGA kompatibilita). Novější karty jako AMD / ATI HD5000-HD7000 ještě chybí 2D akceleraci; musí být emulované 3D hardware. GPU byly původně použity k urychlení paměti náročné práci textury mapování a vykreslování polygonů, později přidáním jednotky k urychlení geometrické výpočty, jako je rotace a translace z vrcholů do různých souřadnicových systémů . Nedávný vývoj v GPU zahrnovat podporu pro programovatelné shaders , které mohou manipulovat vrcholy a struktury s mnoha stejných operací podporovaných CPU , převzorkování a interpolačních technik ke snížení aliasingu , a velmi vysoce přesných barevných prostorů . Protože většina z těchto výpočtů zahrnuje matice a vektorové operace, inženýři a vědci stále studovali použití GPU pro negrafických výpočtů; jsou zvláště vhodné pro jiné trapně paralelní problémy.

Se vznikem hluboké učení, význam GPU zvýšil. Ve výzkumu provedeném podle Indigo, bylo zjištěno, že při tréninku hlubokých učení neuronové sítě, GPU může být 250 krát rychleji než CPU. Explozivní růst Deep učení v posledních letech byl přičítán vznik univerzálních GPU. Došlo k určitému úroveň hospodářské soutěže v této oblasti s ASIC , nejvíce prominentně Processing Unit Tensor (TPU) ze strany Googlu. Ty však mohou vyžadovat změny stávajícího kódu a GPU jsou stále velmi populární.

GPU akcelerované dekódování videa

ATI HD5470 GPU (viz výše) je možné UVD 2.1, která mu umožní dekódování AVC a VC-1 video formáty

Většina GPU vyrobené od roku 1995 podporovat YUV barevný prostor a hardware překryvy , které jsou důležité pro digitální video přehrávání a mnoho GPU dosažený od roku 2000 také podporuje MPEG primitiva, jako kompenzace pohybu a idct . Tento proces hardwarové akcelerované dekódování videa, kde části dekódování videa procesu a videa následné zpracování jsou vyložen na GPU hardware, se běžně označuje jako „GPU akcelerované dekódování videa“, „GPU asistované dekódování videa“, „GPU hardware akcelerované dekódování videa“nebo‚GPU hardware asistované dekódování videa‘.

Novější grafické karty i dekódování videa ve vysokém rozlišení na kartě, vykládání centrální procesorovou jednotku. Mezi nejčastější API pro GPU akcelerované dekódování videa jsou DXVA pro Microsoft Windows operační systém a VDPAU , VAAPI , xvmc a XvBA na bázi Linuxu a UNIX-like operační systémy. Všechny kromě xvmc jsou schopné dekódování videa kódovaných s MPEG-1 , MPEG-2 , MPEG-4 ASP (MPEG-4 část 2) , MPEG-4 AVC (H.264 / DivX 6), VC-1 , WMV3 / WMV9 , Xvid / kodeku (DivX 4), a DivX 5 kodeky , zatímco xvmc je schopen pouze dekódování MPEG-1 a MPEG-2.

dekódování videa procesy, které mohou být urychleny

K dekódování videa procesy, které mohou být urychleno dnešním moderním GPU hardware jsou následující:

GPU formy

Terminologie

V osobních počítačích, existují dvě hlavní formy GPU. Každý z nich má spoustu synonym:

Využití specifických GPU

Většina GPU jsou určeny pro konkrétní použití, real-time 3D grafiky nebo jiných hromadných výpočty:

  1. Gaming
  2. Cloud Gaming
  3. Workstation
  4. Cloud Workstation
  5. Umělá inteligence Cloud
  6. Automatizované / bez řidiče auta

Dedikované grafické karty

Tyto GPU z nejsilnějších třídy typicky rozhraní s deskou pomocí prostřednictvím rozšiřujícím slotu , jako je PCI Express (PCIe) nebo rychlý grafický port (AGP), a mohou být obvykle nahrazeny nebo aktualizován s relativně snadno, za předpokladu, že základní deska je schopná podporovat upgrade. Několik grafických karet i nadále používat Peripheral Component Interconnect (PCI) sloty, ale jejich šířka pásma je tak omezený, že se obvykle používá pouze v případě, PCIe nebo AGP slot není k dispozici.

Vyhrazený GPU není nutně odnímatelný, ani nutně komunikovat s deskou ve standardním způsobem. Pod pojmem „vyhrazené“ odkazuje na skutečnost, že dedikované grafické karty mají paměti RAM , která je věnována používání karty, nikoliv k tomu, že většina dedikované GPU jsou odnímatelné. Dále tato RAM je obvykle speciálně vybrané pro očekávanou sériovou vytížení grafické karty (viz GDDR ). Někdy systémy s vyhrazenými, diskrétní GPU byly nazývány systémy „DIS“, na rozdíl od „UMA“ systémy (viz další část). Dedikované GPU pro přenosné počítače jsou nejčastěji propojeny přes nestandardní a často proprietární slot Vzhledem k velikosti a hmotnosti omezení. Tyto porty mohou být stále považovány za PCIe nebo AGP, pokud jde o jejich logické počítačového rozhraní, i když nejsou fyzicky zaměnitelný s jejich protějšky.

Technologie, jako SLI NVIDIA a CrossFire AMD umožňují více GPU kreslit obrázky současně na jedné obrazovce, čímž se zvyšuje výpočetní výkon dostupný pro grafiku.

integrovaná grafika

Postavení integrované GPU v rozložení northbridge / southbridge systému
ASRock Základní deska s integrovanou grafickou kartou, která má HDMI, VGA a DVI výstupy.

Integrovaná grafická karta , sdílené grafické řešení , integrované grafické procesory (IGP) nebo sjednoceny architektura paměti (UMA) využívá část systémové paměti RAM počítače je spíše než vyhrazené grafické paměti. IGP mohou být integrovány do základní desky jako součást chipsetu nebo na stejný umřít s CPU (jako AMD APU nebo Intel HD Graphics ). Na některých základních desek AMD IGP mohou využít vyhrazené SidePort paměť. Jedná se o samostatnou pevný blok paměti vysokým výkonem, který je určen pro použití v GPU. Na začátku roku 2007, počítače s integrovanou grafickou kartou představují asi 90% všech zásilek PC. Jsou méně nákladné implementovat než vyhrazené grafické zpracování, ale mají tendenci být méně schopný. Historicky, integrované zpracování byl často považován za nezpůsobilý hrát 3D hry nebo spustit graficky náročné programy, ale mohl běžet méně intenzivní programy jako Adobe Flash. Příklady takových IGP by nabídku od SiS i VIA circa 2004. Nicméně, moderní integrované grafické procesory, jako AMD Fusion a Intel HD Graphics jsou více než schopný zvládnout 2D grafiku nebo nízkého pnutí 3D grafiku.

Jako GPU je velmi náročné na paměť, integrované zpracování může ocitnout soutěžit s CPU pro relativně pomalé systémové paměti RAM, protože má minimální nebo žádné vyhrazené grafické paměti. IGP může mít až 29.856 Gb / s na šířku pásma paměti ze systémové paměti RAM, zatímco grafická karta může mít až 264 Gb / s šířky pásma mezi jeho paměti a GPU jádra. Tato sběrnice paměti propustnost může omezit výkon GPU. Starší integrované grafické čipové sady postrádal hardware transformace a osvětlení , ale novější zahrnout.

Zpracování hybridní grafiky

Tento novější třída GPU soupeří s integrovanou grafikou v low-end stolních a přenosných trzích. Mezi nejčastější implementace tohoto jsou ATI HyperMemory a Nvidia TurboCache .

Hybridní grafické karty jsou o něco dražší než integrované grafiky, ale mnohem levnější než dedikované grafické karty. Tito sdílejí paměť se systémem a mají malou vyhrazené paměti cache, aby se na vysokou latencí systémové paměti RAM. Technologies v rámci PCI Express může aby to bylo možné. Zatímco tato řešení jsou někdy inzerovány jak mít tolik jako 768 MB RAM, toto se odkazuje na to, jak moc mohou být sdíleny s systémové paměti.

Zpracování proudu a pro všeobecné použití, GPU (GPGPU)

Je stále více obvyklé použít pro různé účely grafický procesor (GPGPU) jako modifikované formy proudu procesoru (nebo vektorového procesoru ), běh výpočetně jádra . Tento koncept se změní masivní výpočetní výkon Moderní grafický akcelerátor je shader potrubí do univerzálních výpočetního výkonu, jak protichůdný k bytí těžké kabelové výhradně k tomu grafických operací. V určitých aplikacích, které vyžadují masivní vektorové operace, může tento výtěžek o několik řádů vyšší výkon než konvenční CPU. Dvě největší diskrétní (viz „ Vyhrazená grafických karet “ nahoře) GPU návrháři, AMD a Nvidia , začínají sledovat tento přístup s řadou aplikací. Oba Nvidia a AMD se spojila se Stanford University vytvořit klienta GPU-based pro Folding @ home distribuovaný počítačový projekt, pro protein skládací výpočty. Za určitých okolností GPU počítá čtyřicet krát rychleji než konvenční CPU tradičně používané takovými aplikacemi.

GPGPU mohou být použity pro mnoho typů trapně paralelních úkolů, včetně sledování paprsku . Obvykle jsou vhodné pro vysoce výkonných typu výpočty, které vykazují data-rovnoběžnost využít širokou šířku vektor JIMD architekturu GPU.

Navíc, vysoce výkonné počítače GPU-based začínají hrát významnou roli při modelování ve velkém měřítku. Tři z 10 nejvýkonnějších superpočítačů na světě využít GPU akcelerace.

GPU podporuje rozšíření API pro C programovací jazyk, jako je OpenCL a OpenMP . Kromě toho má každý GPU prodejce představil svůj vlastní API, která pracuje pouze se svými kartami, AMD APP SDK a CUDA od AMD a Nvidia, resp. Tyto technologie umožňují specifikované funkce zvané výpočetních jader z normální C program spustit na proudových procesorů GPU je. To umožňuje C programy využít schopnosti GPU k provozu na velkých vyrovnávacích pamětí paralelně, zatímco ještě používá procesor pokud je to vhodné. CUDA je také první API umožňují aplikacím CPU-založené přímo přístup k prostředkům z GPU pro obecnější účely výpočtů bez omezení při použití grafického rozhraní API.

Od roku 2005 tam byl zájem o využití výkonu nabízené GPU pro evolučních algoritmů obecně, a pro urychlení fitness hodnocení v genetickém programování zvláště. Většina přístupů sestavit lineární nebo strom programy na hostitelském počítači a přenášet spustitelný GPU má být spuštěn. Typicky výkon výhoda je získat pouze spuštěním jediné aktivní program současně na mnoha například problémy paralelně pomocí GPU JIMD architektury. Nicméně, podstatné zrychlení mohou být také získány tím, že sestavování programů, a místo toho, jejich převedení do GPU, aby se tam vykládat. Zrychlení pak mohou být získány buď interpretovat více programů současně, zároveň spuštění několika příklady problémů, nebo kombinace obou. Moderní GPU může snadno simultánně tlumočit stovky tisíc velmi malých programů.

Některé moderní pracoviště GPU, například pracovní stanice karet Nvidia Quadro s využitím architektur Volta a Turing, rys věnovat procesorových jader pro použití tensor založené na hluboké učení. V aktuální sérii Nvidia GPU jsou tato jádra tzv tenzoru jádra Tyto GPU obvykle mají významné zvýšení výkonu obvody, využívající 4x4 maticové násobení a dělení, což vede k hardwaru výkon až 128 TFLOPS v některých aplikacích. Tyto tensorová jádra se také předpokládá, že se objeví ve spotřebitelských karet spuštěných architekturu Turing, a případně v sérii Navi spotřebitelských karet od AMD.

Externí GPU (eGPU)

Externí GPU je grafický procesor umístěný vně skříně počítače. Externí grafické procesory jsou někdy používány s přenosných počítačů. Notebooky mohou mít značné množství paměti RAM a dostatečně výkonnou centrální procesorové jednotky (CPU), ale často chybí výkonný grafický procesor a místo toho mají méně výkonný, ale energeticky úspornější palubní grafický čip. On-board grafické čipy nejsou často dostatečně výkonný pro hraní nejnovějších her, nebo z jiných graficky náročných úkolů, jako je střih videa.

Proto je žádoucí, aby bylo možné připojit GPU k nějakému vnějšímu sběrnici notebooku. PCI Express je jediný autobus běžně používané pro tento účel. Port může být, například, ExpressCard nebo mPCIe port (PCIe x 1 až 5 nebo 2,5 Gb / s, v tomto pořadí), nebo Thunderbolt 1, 2, nebo 3 portu (PCIe x 4, a to až do 10, 20, nebo 40 Gb / s, respektive). Tyto porty jsou k dispozici pouze u některých systémů, notebooků.

Vnější GPU měli malou oficiální podporu dodavatele. To však nezastavilo nadšence z provádění eGPU setupy.

Odbyt

V roce 2013, 438,3 milionu GPU byly odeslány na celém světě a předpověď pro rok 2014 byl 414,2 milionů.

viz též

Hardware

API

Aplikace

Reference

externí odkazy