Počítačové úložiště dat - Computer data storage

GiB z SDRAM uložena v počítači . Příklad primárního úložiště .
15  GiB PATA pevný disk (HDD) z roku 1999. Po připojení k počítači slouží jako sekundární úložiště.
Pásková kazeta SDLT 160 GB , příklad offline úložiště. Při použití v rámci robotické páskové knihovny je klasifikována jako terciární úložiště.
Vřeteno DVD-RW

Ukládání počítačových dat je technologie sestávající z počítačových komponent a záznamových médií, která se používají k uchovávání digitálních dat . Jedná se o základní funkci a základní součást počítačů.

Centrální procesorová jednotka (CPU) počítače je to, co manipuluje údaje provedením výpočtů. V praxi téměř všechny počítače používají hierarchii úložiště , která staví rychlé, ale drahé a malé možnosti úložiště blízko k CPU a pomalejší, ale levnější a větší možnosti dále. Obecně se rychlé nestálé technologie (které ztrácejí data, když jsou vypnuté) označují jako „paměť“, zatímco pomalejší perzistentní technologie se označují jako „úložiště“.

Dokonce i první počítačový design, Charles Babbage ‚s analytické motoru a Percy Ludgate ‘ s Analytická Machine, jasně rozlišoval mezi zpracováním a paměti (Babbage uložena čísla jako rotace ozubených kol, zatímco Ludgate uložena čísla jako posunutí tyče v raketoplány). Toto rozlišení bylo rozšířeno ve Von Neumannově architektuře , kde se CPU skládá ze dvou hlavních částí: řídicí jednotky a aritmetické logické jednotky (ALU). První řídí tok dat mezi CPU a pamětí, zatímco druhý provádí aritmetické a logické operace s daty.

Funkčnost

Bez značného množství paměti by byl počítač schopen pouze provádět fixní operace a okamžitě vytisknout výsledek. Musel by být překonfigurován, aby se změnilo jeho chování. To je přijatelné pro zařízení, jako jsou stolní kalkulačky , digitální signálové procesory a další specializovaná zařízení. Von Neumannovy stroje se liší v paměti, do které ukládají své provozní pokyny a data. Takové počítače jsou všestrannější v tom, že nepotřebují překonfigurovat hardware pro každý nový program, ale lze je jednoduše přeprogramovat pomocí nových in-memory instrukcí; také inklinují k jednoduššímu návrhu v tom, že relativně jednoduchý procesor může udržovat stav mezi po sobě jdoucími výpočty, aby vytvořil složité procedurální výsledky. Většina moderních počítačů jsou von Neumannovy stroje.

Organizace a reprezentace dat

Moderní digitální počítač reprezentuje data pomocí dvojkové číselné soustavy . Text, čísla, obrázky, zvuk a téměř všechny další formy informací lze převést na řetězec bitů nebo binárních číslic, z nichž každý má hodnotu 0 nebo 1. Nejběžnější jednotkou úložiště je bajt , rovný na 8 bitů. Část informace může být zpracována jakýmkoli počítačem nebo zařízením, jehož úložný prostor je dostatečně velký, aby pojal binární reprezentaci části informace nebo jednoduše dat . Například kompletní Shakespearova díla , asi 1250 tištěných stran, mohou být uložena v asi pěti megabajtech (40 milionů bitů) s jedním bytem na znak.

Data jsou kódována přiřazením bitového vzoru každému znaku , číslici nebo multimediálnímu objektu. Existuje mnoho standardů pro kódování (např. kódování znaků jako ASCII , kódování obrázků jako JPEG , kódování videa jako MPEG-4 ).

Přidáním bitů do každé kódované jednotky umožňuje redundance počítači jak detekovat chyby v kódovaných datech, tak je opravovat na základě matematických algoritmů. Chyby se obecně vyskytují s nízkou pravděpodobností v důsledku náhodného překlápění bitové hodnoty nebo „fyzické únavy bitů“, ztráty fyzického bitu v úložišti jeho schopnosti udržet rozlišitelnou hodnotu (0 nebo 1) nebo v důsledku chyb v inter nebo intra- počítačová komunikace. Náhodné převrácení bitu (např. v důsledku náhodného záření ) je obvykle opraveno při detekci. Bit nebo skupina nefunkčních fyzických bitů (ne vždy je znám konkrétní vadný bit; definice skupiny závisí na konkrétním úložném zařízení) je obvykle automaticky chráněna, zařízením vyřazena z používání a nahrazena jinou funkční ekvivalentní skupinou. v zařízení, kde jsou opravené hodnoty bitů obnoveny (pokud je to možné). Metoda cyklické redundantní kontroly (CRC) se obvykle používá v komunikaci a ukládání pro detekci chyb . Zjištěná chyba je poté opakována.

Metody komprese dat umožňují v mnoha případech (jako je databáze) reprezentovat řetězec bitů kratším bitovým řetězcem ("komprimovat") a v případě potřeby rekonstruovat původní řetězec ("dekomprimovat"). To využívá podstatně méně úložného prostoru (desítky procent) pro mnoho typů dat za cenu většího výpočtu (v případě potřeby komprimovat a dekomprimovat). Analýza kompromisu mezi úsporou nákladů na úložiště a náklady souvisejících výpočtů a možným zpožděním v dostupnosti dat se provádí před rozhodnutím, zda ponechat určitá data komprimovaná či nikoli.

Z bezpečnostních důvodů mohou být určité typy dat (např. informace o kreditních kartách) uchovávány zašifrované v úložišti, aby se zabránilo možnosti neoprávněné rekonstrukce informací z bloků snímků úložiště.

Hierarchie úložiště

Různé formy úložiště, rozdělené podle vzdálenosti od centrální procesorové jednotky . Základními součástmi univerzálního počítače jsou aritmetická a logická jednotka , řídicí obvody , úložný prostor a vstupní/výstupní zařízení. Technologie a kapacita jako u běžných domácích počítačů kolem roku 2005.

Obecně platí, že čím níže je úložiště v hierarchii, tím menší je jeho šířka pásma a tím větší je jeho latence přístupu z CPU. Toto tradiční rozdělení úložiště na primární, sekundární, terciární a off-line úložiště se také řídí cenou za bit.

V současném použití je paměť obvykle polovodičové úložiště pro čtení a zápis s náhodným přístupem , typicky DRAM (dynamická RAM) nebo jiné formy rychlého, ale dočasného úložiště. Skladování se skládá ze zařízení pro ukládání dat a jejich médií, které nejsou přímo přístupné pomocí CPU ( sekundární nebo terciární skladování ), typicky pevné disky , diskové optické disky a další zařízení pomaleji než RAM, ale netěkavých (zachování obsahu při napájení dolů).

Historicky se paměť nazývala jádrová paměť , hlavní paměť , skutečné úložiště nebo vnitřní paměť . Mezitím byla energeticky nezávislá paměťová zařízení označována jako sekundární úložiště , externí paměť nebo pomocné/periferní úložiště .

Primární úložiště

Primární úložiště (také známé jako hlavní paměť , interní paměť nebo primární paměť ), často označované jednoduše jako paměť , je jediné přímo přístupné CPU. CPU nepřetržitě čte instrukce tam uložené a provádí je podle potřeby. Jednotně se tam ukládají i veškerá data aktivně provozovaná.

Historicky, rané počítače používaly zpožďovací linky , Williamsovy trubice nebo točivé magnetické bubny jako primární úložiště. V roce 1954 byly tyto nespolehlivé metody většinou nahrazeny pamětí magnetického jádra . Paměť jádra zůstala dominantní až do 70. let 20. století, kdy pokroky v technologii integrovaných obvodů umožnily, aby se polovodičové paměti staly ekonomicky konkurenceschopnými.

To vedlo k moderní paměti s náhodným přístupem (RAM). Je malý, lehký, ale zároveň dost drahý. (Konkrétní typy paměti RAM používané pro primární úložiště jsou také nestálé , tj. ztrácejí informace, když nejsou napájeny).

Jak je znázorněno na obrázku, tradičně existují dvě další podvrstvy primárního úložiště, kromě hlavní velkokapacitní paměti RAM:

  • Registry procesoru jsou umístěny uvnitř procesoru. Každý registr obvykle obsahuje slovo dat (často 32 nebo 64 bitů). Instrukce CPU přikazují aritmeticko logické jednotce provádět různé výpočty nebo jiné operace s těmito daty (nebo s jejich pomocí). Registry jsou nejrychlejší ze všech forem ukládání počítačových dat.
  • Cache procesoru je mezistupeň mezi ultrarychlými registry a mnohem pomalejší hlavní pamětí. Byl představen pouze za účelem zlepšení výkonu počítačů. Většina aktivně používaných informací v hlavní paměti je pouze duplikována v mezipaměti, která je rychlejší, ale má mnohem menší kapacitu. Na druhou stranu je hlavní paměť mnohem pomalejší, ale má mnohem větší úložnou kapacitu než registry procesoru. Běžně se také používá víceúrovňové hierarchické nastavení cacheprimární cache je nejmenší, nejrychlejší a umístěná uvnitř procesoru; sekundární mezipaměť je poněkud větší a pomalejší.

Hlavní paměť je přímo nebo nepřímo připojena k centrální procesorové jednotce prostřednictvím paměťové sběrnice . Jsou to vlastně dvě sběrnice (není na schématu): adresová sběrnice a datová sběrnice . CPU nejprve odešle přes adresovou sběrnici číslo, které se nazývá adresa paměti , které označuje požadované umístění dat. Poté pomocí datové sběrnice čte nebo zapisuje data do paměťových buněk . Navíc jednotka správy paměti (MMU) je malé zařízení, mezi CPU a RAM přepočítává aktuální adresu paměti, například poskytnout abstrakce virtuální paměti nebo jiné úkoly.

Vzhledem k tomu, že typy paměti RAM používané pro primární úložiště jsou nestálé (neinicializované při spuštění), počítač obsahující pouze takové úložiště by neměl zdroj, ze kterého by mohl číst pokyny, aby mohl počítač spustit. Proto se energeticky nezávislé primární úložiště obsahující malý spouštěcí program ( BIOS ) používá k bootstrapu počítače, to znamená ke čtení většího programu z energeticky nezávislého sekundárního úložiště do RAM a jeho spuštění. Energeticky nezávislá technologie používaná pro tento účel se nazývá ROM, pro paměť pouze pro čtení (terminologie může být poněkud matoucí, protože většina typů ROM je také schopna náhodného přístupu ).

Mnoho typů "ROM" není doslova pouze pro čtení , protože jsou možné jejich aktualizace; je však pomalá a paměť musí být vymazána ve velkých částech, než ji lze přepsat. Některé vestavěné systémy spouštějí programy přímo z ROM (nebo podobné), protože takové programy se mění jen zřídka. Standardní počítače neukládají do paměti ROM jiné než základní programy a spíše využívají velké kapacity sekundárního úložiště, které je také energeticky nezávislé a není tak nákladné.

V poslední době primární úložiště a sekundární úložiště v některých použitích odkazují na to, co se historicky nazývalo sekundární úložiště a terciární úložiště .

Vedlejší sklad

Pevný disk s ochranným krytem odstraněny

Sekundární úložiště (také známé jako externí paměť nebo pomocné úložiště ) se liší od primárního úložiště tím, že k němu není přímo přístupný procesor. Počítač obvykle používá své vstupní/výstupní kanály pro přístup k sekundárnímu úložišti a přenos požadovaných dat do primárního úložiště. Sekundární úložiště je energeticky nezávislé (uchovává data, když je vypnuto). Moderní počítačové systémy mají obvykle o dva řády více sekundárního úložiště než primární úložiště, protože sekundární úložiště je levnější.

V moderních počítačích se jako sekundární úložiště obvykle používají pevné disky (HDD) nebo SSD ( solid-state drive ). Doba přístupu na bajt u pevných disků nebo SSD se obvykle měří v milisekundách (jedna tisícina sekund), zatímco doba přístupu na bajt u primárního úložiště se měří v nanosekundách (jedna miliardtina sekundy). Sekundární úložiště je tedy výrazně pomalejší než primární úložiště. Rotující optická paměťová zařízení, jako jsou jednotky CD a DVD , mají ještě delší dobu přístupu. Mezi další příklady technologií sekundárního úložiště patří USB flash disky , diskety , magnetické pásky , papírové pásky , děrné štítky a RAM disky .

Jakmile čtecí/zapisovací hlava na HDD dosáhne správného umístění a dat, jsou následující data na stopě velmi rychle přístupná. Aby se zkrátila doba vyhledávání a latence rotace, data se přenášejí na disky az disků ve velkých souvislých blocích. Sekvenční nebo blokový přístup na disky je řádově rychlejší než náhodný přístup a bylo vyvinuto mnoho sofistikovaných paradigmat pro návrh účinných algoritmů založených na sekvenčním a blokovém přístupu. Dalším způsobem, jak snížit I/O úzké místo, je použití více disků paralelně, aby se zvýšila šířka pásma mezi primární a sekundární pamětí.

Sekundární úložiště je často formátováno podle formátu systému souborů, který poskytuje abstrakci nezbytnou k uspořádání dat do souborů a adresářů a zároveň poskytuje metadata popisující vlastníka určitého souboru, dobu přístupu, přístupová oprávnění a další informace.

Většina počítačových operačních systémů používá koncept virtuální paměti , která umožňuje využití větší kapacity primárního úložiště, než je v systému fyzicky dostupné. Jakmile se primární paměť zaplní, systém přesune nejméně používané bloky ( stránky ) do odkládacího souboru nebo stránkovacího souboru na sekundárním úložišti a v případě potřeby je načte později. Pokud se mnoho stránek přesune do pomalejšího sekundárního úložiště, výkon systému se sníží.

Terciární úložiště

Velká pásková knihovna s páskovými kazetami umístěnými na policích vpředu a robotickým ramenem pohybujícím se vzadu. Viditelná výška knihovny je cca 180 cm.

Terciální úložiště nebo terciální paměť je úroveň pod sekundárním úložištěm. Typicky to zahrnuje robotický mechanismus, který bude připojovat (vkládat) a vyjímat vyměnitelná velkokapacitní paměťová média do paměťového zařízení podle požadavků systému; taková data jsou často před použitím zkopírována do sekundárního úložiště. Primárně se používá pro archivaci zřídka dostupných informací, protože je mnohem pomalejší než sekundární úložiště (např. 5–60 sekund vs. 1–10 milisekund). To je užitečné především pro mimořádně velká úložiště dat, ke kterým lze přistupovat bez lidské obsluhy. Typické příklady zahrnují páskové knihovny a optické jukeboxy .

Když počítač potřebuje načíst informace z terciárního úložiště, nejprve se podívá do databáze katalogu, aby určil, která páska nebo disk informace obsahuje. Dále počítač dá pokyn robotické paži, aby médium vyzvedla a vložila do jednotky. Když počítač dokončí čtení informací, robotické rameno vrátí médium na své místo v knihovně.

Terciární úložiště je také známé jako blízké úložiště, protože je „blízko online“. Formální rozdíl mezi online, nearline a offline úložištěm je:

  • Online úložiště je okamžitě k dispozici pro I/O.
  • Nearline úložiště není okamžitě k dispozici, ale lze jej rychle vytvořit online bez lidského zásahu.
  • Offline úložiště není okamžitě dostupné a vyžaduje určitý lidský zásah, aby se stal online.

Například vždy zapnuté rotující pevné disky jsou online úložiště, zatímco rotující disky, které se automaticky roztočí, jako například v masivních polích nečinných disků ( MAID ), jsou nearline storage. Vyměnitelná média, jako jsou páskové kazety, které lze automaticky zavést, jako v páskových knihovnách , jsou úložiště typu near-line, zatímco páskové kazety, které je třeba zavést ručně, jsou úložiště offline.

Off-line úložiště

Off-line úložiště je ukládání počítačových dat na médium nebo zařízení, které není pod kontrolou zpracovatelské jednotky . Médium je zaznamenáno, obvykle v sekundárním nebo terciárním paměťovém zařízení, a poté fyzicky odstraněno nebo odpojeno. Musí být vložen nebo připojen lidským operátorem, než k němu bude mít počítač opět přístup. Na rozdíl od terciárního úložiště k němu nelze přistupovat bez lidské interakce.

Off-line úložiště se používá k přenosu informací , protože oddělené médium lze snadno fyzicky přepravovat. Navíc je to užitečné pro případy katastrofy, kdy například požár zničí původní data, médium na vzdáleném místě nebude ovlivněno, což umožní obnovu po havárii . Offline úložiště zvyšuje obecnou bezpečnost informací , protože je fyzicky nepřístupné z počítače a důvěrnost nebo integrita dat nemůže být ovlivněna technikami počítačového útoku. Pokud jsou informace uložené pro archivační účely přístupné jen zřídka, je off-line úložiště levnější než terciární úložiště.

V moderních osobních počítačích se většina sekundárních a terciárních paměťových médií používá také pro off-line ukládání. Nejoblíbenější jsou optické disky a flash paměťová zařízení a v mnohem menší míře vyměnitelné pevné disky. V podnikovém použití převládá magnetická páska. Staršími příklady jsou diskety, zip disky nebo děrné štítky.

Charakteristika skladování

Technologie úložišť na všech úrovních hierarchie úložišť lze odlišit vyhodnocením určitých základních charakteristik a také měřením charakteristik specifických pro konkrétní implementaci. Těmito základními charakteristikami jsou volatilita, proměnlivost, dostupnost a adresovatelnost. Pro každou konkrétní implementaci jakékoli úložné technologie je třeba měřit kapacitu a výkon.

Přehled
Charakteristický Pevný disk Optický disk Flash paměť Paměť s náhodným přístupem Lineární páska otevřená
Technika Magnetický disk Laserový paprsek Polovodič Magnetická páska
Volatilita Ne Ne Ne Nestálý Ne
Náhodný přístup Ano Ano Ano Ano Ne
Latence ( doba přístupu) ~15 ms (rychle) ~150 ms (střední) Žádné (okamžité) Žádné (okamžité) Nedostatek náhodného přístupu (velmi pomalý)
Ovladač Vnitřní Externí Vnitřní Vnitřní Externí
Selhání s hrozící ztrátou dat Náraz hlavy Obvody
Detekce chyb Diagnostika ( SMART ) Chybovost měření Indikováno klesajícími přenosovými rychlostmi (Krátkodobé skladování) Neznámý
Cena za prostor Nízký Nízký Vysoký Velmi vysoko Velmi nízké (ale drahé disky)
Cena za jednotku Mírný Nízký Mírný Vysoký Střední (ale drahé disky)
Hlavní aplikace Střednědobá archivace, rozšíření úložiště serverů a pracovních stanic Dlouhodobá archivace, tištěná distribuce Přenosná elektronika; operační systém Reálný čas Dlouhodobě archivní

Volatilita

Energeticky nezávislá paměť uchovává uložené informace, i když není trvale zásobována elektrickou energií. Je vhodný pro dlouhodobé uchovávání informací. Nestálá paměť vyžaduje neustálé napájení pro udržení uložených informací. Nejrychlejší paměťové technologie jsou volatilní, i když to není univerzální pravidlo. Vzhledem k tomu, že primární úložiště musí být velmi rychlé, používá převážně volatilní paměť.

Dynamická paměť s náhodným přístupem je forma nestálé paměti, která také vyžaduje, aby uložené informace byly pravidelně znovu načítány a přepisovány nebo obnovovány , jinak by zmizely. Statická paměť s náhodným přístupem je formou volatilní paměti podobnou DRAM s tou výjimkou, že se nikdy nemusí obnovovat, pokud je připojeno napájení; při ztrátě napájení ztratí svůj obsah.

Zdroj nepřerušitelného napájení (UPS) může být použit k tomu, aby měl počítač krátký časový úsek na přesun informací z primárního energeticky nezávislého úložiště do energeticky nezávislého úložiště, než se vybijí baterie. Některé systémy, například EMC Symmetrix , mají integrované baterie, které udržují volatilní úložiště po dobu několika minut.

Proměnlivost

Úložiště pro čtení/zápis nebo proměnlivé úložiště
Umožňuje kdykoli přepsat informace. Počítač bez určitého množství úložiště pro čtení/zápis pro účely primárního úložiště by byl pro mnoho úkolů k ničemu. Moderní počítače obvykle používají úložiště pro čtení/zápis také pro sekundární úložiště.
Pomalý zápis, rychlé čtení úložiště
Úložiště pro čtení/zápis, které umožňuje vícenásobné přepisování informací, ale operace zápisu je mnohem pomalejší než operace čtení. Příklady zahrnují CD-RW a SSD .
Zápis jednou úložiště
WORM (World Once Read Many ) umožňuje zapsat informace pouze jednou v určitém okamžiku po výrobě. Příklady zahrnují polovodičovou programovatelnou paměť pouze pro čtení a CD-R .
Úložiště pouze pro čtení
Uchovává informace uložené v době výroby. Příklady zahrnují maskové ROM IC a CD-ROM .

Přístupnost

Náhodný přístup
Jakékoli místo v úložišti může být přístupné kdykoli během přibližně stejného času. Tato vlastnost je vhodná pro primární a sekundární skladování. Většina polovodičových pamětí a diskových jednotek poskytuje náhodný přístup, ačkoli pouze flash paměť podporuje náhodný přístup bez zpoždění , protože není třeba přesouvat žádné mechanické části.
Sekvenční přístup
Přístup k informacím bude v sériovém pořadí, jeden po druhém; doba přístupu ke konkrétní informaci proto závisí na tom, která informace byla naposledy zpřístupněna. Tato vlastnost je typická pro off-line ukládání.

Adresovatelnost

Lokalně adresovatelné
Každá jednotlivě přístupná jednotka informace v úložišti je vybrána pomocí své číselné adresy paměti . V moderních počítačích se umístění adresovatelné úložiště obvykle omezuje na primární úložiště, ke kterému interně přistupují počítačové programy, protože adresovatelnost umístění je velmi efektivní, ale pro člověka zatěžující.
Soubor adresovatelný
Informace jsou rozděleny do souborů s proměnlivou délkou a je vybrán konkrétní soubor s lidmi čitelnými názvy adresářů a souborů. Základní zařízení je stále adresovatelné podle umístění, ale operační systém počítače poskytuje abstrakci souborového systému, aby byla operace srozumitelnější. V moderních počítačích sekundární, terciární a off-line úložiště používají systémy souborů.
Obsahově adresovatelné
Každá jednotlivě přístupná jednotka informace je vybrána na základě (části) obsahu, který je v ní uložen. Obsahově adresovatelné úložiště lze implementovat pomocí softwaru (počítačového programu) nebo hardwaru (počítačové zařízení), přičemž hardware je rychlejší, ale dražší varianta. Adresovatelná paměť hardwarového obsahu se často používá v mezipaměti CPU počítače .

Kapacita

Surová kapacita
Celkové množství uložených informací, které pojme paměťové zařízení nebo médium. Vyjadřuje se jako množství bitů nebo bajtů (např. 10,4 megabajtů ).
Hustota ukládání paměti
Kompaktnost uložených informací. Je to úložná kapacita média dělená jednotkou délky, plochy nebo objemu (např. 1,2 megabajtů na čtvereční palec).

Výkon

Latence
Čas, který trvá přístup k určitému umístění v úložišti. Relevantní jednotkou měření je typicky nanosekunda pro primární úložiště, milisekunda pro sekundární úložiště a sekunda pro terciární úložiště. Může mít smysl oddělit latenci čtení a latenci zápisu (zejména pro energeticky nezávislou paměť) a v případě ukládání sekvenčního přístupu minimální, maximální a průměrnou latenci.
Propustnost
Rychlost, kterou lze číst informace z úložiště nebo do něj zapisovat. Při ukládání počítačových dat je propustnost obvykle vyjádřena v megabajtech za sekundu (MB/s), ačkoli lze použít i přenosovou rychlost . Stejně jako u latence může být nutné rozlišovat rychlost čtení a rychlost zápisu. Také postupný přístup k médiím, na rozdíl od náhodného, ​​obvykle poskytuje maximální propustnost.
Zrnitost
Velikost největšího „kusu“ dat, ke kterému lze efektivně přistupovat jako k jedné jednotce, např. bez zavedení dodatečné latence.
Spolehlivost
Pravděpodobnost spontánní změny hodnoty bitu za různých podmínek nebo celková poruchovost .

K měření výkonu IO v Linuxu lze použít nástroje jako hdparm a sar .

Spotřeba energie

  • Úložná zařízení, která snižují spotřebu ventilátoru, se automaticky vypínají během nečinnosti a nízkoenergetické pevné disky mohou snížit spotřebu energie o 90 procent.
  • 2,5palcové pevné disky často spotřebují méně energie než ty větší. Nízkokapacitní disky SSD nemají žádné pohyblivé části a spotřebovávají méně energie než pevné disky. Paměť také může spotřebovávat více energie než pevné disky. Velké mezipaměti, které se používají k tomu, aby se zabránilo zasažení paměťové zdi , mohou také spotřebovat velké množství energie.

Bezpečnostní

Full Disk Encryption , objem a virtuální šifrování disku, Andor šifrování souborů / složek je snadno dostupné pro většinu zařízení pro ukládání dat.

Hardwarové šifrování paměti je dostupné v architektuře Intel, která podporuje Total Memory Encryption (TME) a ​​stránkové granulární šifrování paměti s více klíči (MKTME). a v generaci SPARC M7 od října 2015.

Zranitelnost a spolehlivost

Varování softwaru SMART upozorňuje na blížící se selhání pevného disku

Jednotlivé typy datových úložišť mají různá místa selhání a různé metody prediktivní analýzy selhání .

Zranitelnosti, které mohou okamžitě vést k úplné ztrátě, jsou nárazy hlavy na mechanické pevné disky a selhání elektronických součástek na flash úložišti.

Detekce chyb

Měření chybovosti na DVD+R . Drobné chyby jsou opravitelné a ve zdravém rozsahu.

Hrozící selhání na jednotkách pevného disku lze odhadnout pomocí diagnostických dat SMART, která zahrnují hodiny provozu a počet roztočení, i když jeho spolehlivost je sporná.

Flash úložiště může zaznamenat pokles přenosových rychlostí v důsledku hromadění chyb, které se řadič flash paměti pokouší opravit.

Stav optických médií lze určit měřením opravitelných menších chyb , z nichž vysoké počty znamenají zhoršující se a/nebo nekvalitní média. Příliš mnoho po sobě jdoucích menších chyb může vést k poškození dat. Ne všichni výrobci a modely optických jednotek podporují skenování chyb.

Paměťová média

Od roku 2011 jsou nejběžněji používaná média pro ukládání dat polovodičová, magnetická a optická, zatímco použití papíru je stále omezené. Pro vývoj jsou navrženy některé další základní technologie úložiště, jako jsou all-flash pole (AFA).

Polovodič

Polovodičová paměť používá k ukládání informací čipy s integrovaným obvodem (IC) na bázi polovodičů . Data jsou obvykle uložena v paměťových buňkách typu metal–oxid–semiconductor (MOS) . Polovodičový paměťový čip může obsahovat miliony paměťových buněk, které se skládají z malých MOS tranzistorů s efektem pole (MOSFET) a/nebo MOS kondenzátorů . Existují jak těkavé, tak energeticky nezávislé formy polovodičové paměti, první používají standardní MOSFETy a druhé používají MOSFETy s plovoucí bránou .

V moderních počítačích se primární úložiště téměř výhradně skládá z dynamické nestálé polovodičové paměti s náhodným přístupem (RAM), zejména dynamické paměti s náhodným přístupem (DRAM). Od přelomu století se typ energeticky nezávislé polovodičové paměti s plovoucím hradlem známý jako flash paměť neustále prosazuje jako off-line úložiště pro domácí počítače. Energeticky nezávislé polovodičové paměti se také používají pro sekundární úložiště v různých pokročilých elektronických zařízeních a specializovaných počítačích, které jsou pro ně určeny.

Již v roce 2006 začali výrobci notebooků a stolních počítačů používat flash disky SSD jako výchozí možnosti konfigurace pro sekundární úložiště, a to buď jako doplněk k tradičnějšímu HDD, nebo místo něj.

Magnetický

Magnetické úložiště využívá k ukládání informací různé vzory magnetizace na magneticky potaženém povrchu. Magnetické úložiště je energeticky nezávislé . K informacím se přistupuje pomocí jedné nebo více čtecích/zapisovacích hlav, které mohou obsahovat jeden nebo více záznamových převodníků. Čtecí/zapisovací hlava pokrývá pouze část povrchu, takže hlavu nebo médium nebo obojí musí být posunuto vzhledem k jinému, aby bylo možné získat přístup k datům. V moderních počítačích bude mít magnetické úložiště tyto formy:

V raných počítačích bylo magnetické úložiště také používáno jako:

Magnetické úložiště nemá určitý limit přepisovacích cyklů, jako je flash úložiště a přepisovatelná optická média, protože změna magnetických polí nezpůsobuje žádné fyzické opotřebení. Jejich životnost je spíše omezena mechanickými díly.

Optický

Optické úložiště , typický optický disk , ukládá informace v deformacích na povrchu kruhového disku a čte tyto informace osvícením povrchu laserovou diodou a pozorováním odrazu. Paměť na optickém disku je energeticky nezávislá . Deformity mohou být trvalé (média pouze pro čtení), vytvořené jednou (média pro jeden zápis) nebo reverzibilní (média pro záznam nebo čtení/zápis). V současné době se běžně používají následující formuláře:

  • CD , CD-ROM , DVD , BD-ROM : Úložiště pouze pro čtení, používané pro hromadnou distribuci digitálních informací (hudba, video, počítačové programy)
  • CD-R , DVD-R , DVD+R , BD-R : Jednorázové úložiště, používané pro terciární a off-line úložiště
  • CD-RW , DVD-RW , DVD+RW , DVD-RAM , BD-RE : Pomalý zápis, rychlé čtení úložiště, používá se pro terciární a off-line úložiště
  • Ultra Density Optical neboli UDO má podobnou kapacitu jako BD-R nebo BD-RE a je to úložiště s pomalým zápisem a rychlým čtením používané pro terciární a off-line úložiště.

Magneto-optické diskové úložiště je optické diskové úložiště, kde magnetický stav na feromagnetickém povrchu ukládá informace. Informace jsou čteny opticky a zapisovány kombinací magnetických a optických metod. Skladování Magneto-optický disk, je netěkavá , sekvenční přístup , pomalý zápis, rychlé čtení skladování používá terciárního a off-line skladování.

Bylo také navrženo 3D optické ukládání dat .

Světlem indukované magnetizační tavení v magnetických fotovodičích bylo také navrženo pro vysokorychlostní magnetooptické ukládání s nízkou spotřebou energie.

Papír

Papírové úložiště dat , typicky ve formě papírové pásky nebo děrných štítků , se dlouho používalo k ukládání informací pro automatické zpracování, zejména před tím, než existovaly počítače pro všeobecné použití. Informace byly zaznamenány vyražením otvorů do papírového nebo kartonového média a byly přečteny mechanicky (nebo později opticky), aby se určilo, zda konkrétní místo na médiu bylo pevné nebo obsahovalo díru. Čárové kódy umožňují, aby předměty, které jsou prodávány nebo přepravovány, měly bezpečně připojeny některé počítačem čitelné informace.

Relativně malá množství digitálních dat (ve srovnání s jinými digitálními datovými úložišti) mohou být zálohována na papíře jako maticový čárový kód pro velmi dlouhodobé uchování, protože životnost papíru obvykle přesahuje i magnetické ukládání dat.

Jiná paměťová média nebo substráty

Paměť vakuové trubice
Williams trubka používá katodové trubice , a Selectron trubka používá velký elektronku pro ukládání informací. Tato primární úložná zařízení byla na trhu krátkodobá, protože Williamsova trubice byla nespolehlivá a trubka Selectron byla drahá.
Elektroakustická paměť
Paměť zpožděné linky využívala k ukládání informací zvukové vlny v látce, jako je rtuť . Paměť zpožděné linky byla dynamicky volatilní, cyklovala sekvenční úložiště pro čtení/zápis a byla používána pro primární úložiště.
Optická páska
je médium pro optické ukládání, které se obvykle skládá z dlouhého a úzkého pruhu plastu, na který lze zapisovat vzory a ze kterého lze vzory zpětně číst. Sdílí některé technologie s filmem v kině a optickými disky, ale není kompatibilní ani s jedním. Motivací za vývojem této technologie byla možnost mnohem větších úložných kapacit než u magnetické pásky nebo optických disků.
Paměť se změnou fáze
používá různé mechanické fáze materiálu se změnou fáze k ukládání informací do adresovatelné matice X–Y a čte informace pozorováním měnícího se elektrického odporu materiálu. Paměť se změnou fáze by byla energeticky nezávislá, úložiště pro čtení/zápis s náhodným přístupem a mohla by být použita pro primární, sekundární a off-line úložiště. Většina přepisovatelných optických disků a mnoho optických disků s možností jednorázového zápisu již používá k ukládání informací materiál se změnou fáze.
Ukládání holografických dat
uchovává informace opticky uvnitř krystalů nebo fotopolymerů . Holografické úložiště může využít celý objem paměťového média, na rozdíl od úložiště optických disků, které je omezeno na malý počet povrchových vrstev. Holografické úložiště by bylo energeticky nezávislé, se sekvenčním přístupem a buď s jednorázovým zápisem, nebo úložištěm pro čtení/zápis. Může být použit pro sekundární a off-line úložiště. Viz Holografický univerzální disk (HVD).
Molekulární paměť
uchovává informace v polymeru, který může uchovávat elektrický náboj. Molekulární paměť může být zvláště vhodná pro primární úložiště. Teoretická úložná kapacita molekulární paměti je 10 terabitů na čtvereční palec (16 Gbit/mm 2 ).
Magnetické fotovodiče
ukládat magnetické informace, které lze upravit osvětlením při slabém osvětlení.
DNA
uchovává informace v nukleotidech DNA . Poprvé to bylo provedeno v roce 2012, kdy vědci dosáhli poměru 1,28 petabajtu na gram DNA. V březnu 2017 vědci oznámili, že nový algoritmus zvaný fontána DNA dosáhl 85 % teoretického limitu, tedy 215 petabajtů na gram DNA.

Související technologie

Nadbytek

Zatímco chybnou funkci skupiny bitů lze vyřešit mechanismy detekce chyb a oprav (viz výše), porucha paměťového zařízení vyžaduje různá řešení. Následující řešení jsou běžně používaná a platná pro většinu úložných zařízení:

  • Zrcadlení zařízení (replikace) – Běžným řešením problému je neustálé udržování identické kopie obsahu zařízení na jiném zařízení (obvykle stejného typu). Nevýhodou je, že se tím zdvojnásobí úložiště a obě zařízení (kopie) je třeba aktualizovat současně s určitou režií a možná i zpožděním. Výhodou je možné současné čtení stejné datové skupiny dvěma nezávislými procesy, což zvyšuje výkon. Když je jedno z replikovaných zařízení detekováno jako vadné, druhá kopie je stále funkční a je využívána ke generování nové kopie na jiném zařízení (pro tento účel je obvykle k dispozici v provozu ve skupině záložních zařízení).
  • Redundantní pole nezávislých disků ( RAID ) – Tato metoda zobecňuje výše uvedené zrcadlení zařízení tím, že umožňuje jednomu zařízení ze skupiny N selhat a být nahrazeno obnoveným obsahem (Zrcadlení zařízení je RAID s N=2). Běžné jsou skupiny RAID N=5 nebo N=6. N>2 šetří úložiště ve srovnání s N=2 za cenu většího zpracování jak při běžném provozu (s často sníženým výkonem), tak při výměně vadného zařízení.

Zrcadlení zařízení a typický RAID jsou navrženy tak, aby zvládly selhání jednoho zařízení ve skupině zařízení RAID. Pokud však dojde k druhému selhání dříve, než je skupina RAID zcela opravena z prvního selhání, může dojít ke ztrátě dat. Pravděpodobnost jednotlivé poruchy je obvykle malá. Pravděpodobnost dvou selhání ve stejné skupině RAID v časové blízkosti je tedy mnohem menší (přibližně druhá mocnina pravděpodobnosti, tj. vynásobená sama sebou). Pokud databáze nesnese ani takovou menší pravděpodobnost ztráty dat, pak se replikuje (zrcadlí) samotná RAID skupina. V mnoha případech se takové zrcadlení provádí geograficky vzdáleně, v jiném poli úložišť, aby se zvládlo také zotavení po haváriích (viz zotavení po havárii výše).

Síťová konektivita

Sekundární nebo terciární úložiště se může připojit k počítači pomocí počítačových sítí . Tento koncept se netýká primárního úložiště, které je v menší míře sdíleno mezi více procesory.

  • Direct-attached storage (DAS) je tradiční velkokapacitní úložiště, které nepoužívá žádnou síť. Toto je stále nejoblíbenější přístup. Toto retronymum bylo vytvořeno nedávno společně s NAS a SAN.
  • Network-attached storage (NAS) je velkokapacitní úložiště připojené k počítači, ke kterému může jiný počítač přistupovat na úrovni souborů přes místní síť , privátní rozlehlou síť nebo v případě online úložiště souborů přes internet . NAS je běžně spojen s protokoly NFS a CIFS/SMB .
  • Storage area network (SAN) je specializovaná síť, která poskytuje ostatním počítačům úložnou kapacitu. Zásadní rozdíl mezi NAS a SAN spočívá v tom, že NAS představuje a spravuje souborové systémy klientským počítačům, zatímco SAN poskytuje přístup na úrovni blokového adresování (raw), přičemž správu dat nebo souborových systémů v rámci poskytnuté kapacity ponechává na připojených systémech. SAN je běžně spojována se sítěmi Fibre Channel .

Robotické úložiště

Velká množství jednotlivých magnetických pásek a optických nebo magnetooptických disků mohou být uložena v robotických terciárních paměťových zařízeních. V oblasti páskového úložiště jsou známé jako páskové knihovny a v oblasti optického úložiště optické jukeboxy nebo knihovny optických disků podle analogie. Nejmenší formy obou technologií obsahující pouze jedno hnací zařízení se označují jako automatické nakladače nebo automatické měniče .

Úložná zařízení s robotickým přístupem mohou mít řadu slotů, z nichž každý drží jednotlivá média a obvykle jednoho nebo více vychystávacích robotů, které procházejí sloty a načítají média do vestavěných jednotek. Uspořádání štěrbin a sběracích zařízení ovlivňuje výkon. Důležitými vlastnostmi takového úložiště jsou možné možnosti rozšíření: přidání slotů, modulů, jednotek, robotů. Páskové knihovny mohou mít od 10 do více než 100 000 slotů a poskytovat terabajty nebo petabajty téměř řádkových informací. Optické jukeboxy jsou poněkud menší řešení, do 1000 slotů.

Robotické úložiště se používá pro zálohování a pro vysokokapacitní archivy v obrazovém, lékařském a video průmyslu. Hierarchická správa úložiště je nejznámější archivační strategie automatické migrace dlouho nepoužívaných souborů z rychlého úložiště na pevném disku do knihoven nebo jukeboxů. Pokud jsou soubory potřeba, načtou se zpět na disk.

Viz také

Témata primárního úložiště

Témata sekundárního, terciárního a off-line úložiště

Konference o ukládání dat

Reference

Veřejná doména Tento článek zahrnuje  materiál ve veřejném vlastnictví z dokumentu General Services Administration : "Federal Standard 1037C" .

Další čtení