SAP HANA - SAP HANA

SAP HANA
Logo SAP SE
Vývojáři SAP SE
První vydání 2010 ( 2010 )
Stabilní uvolnění 2.0 SPS05 (26. června 2020 ; před 12 měsíci ) [±] ( 2020-06-26 )
Napsáno C , C ++
Operační systém Linux
K dispozici v Angličtina
Typ Databáze více modelů
Licence Proprietární komerční software
webová stránka www .sap .com / products / hana .html

SAP HANA (vysoce výkonný analytický přístroj) je v paměti , column-orientovaný , relační databázový systém vyvinutý a prodávaný firmou SAP . Jeho primární funkcí jako softwaru provozujícího databázový server je ukládat a načítat data podle požadavků aplikací. Kromě toho provádí pokročilou analytiku ( prediktivní analytika , zpracování prostorových dat , textová analýza, textové vyhledávání, analytika streamování , zpracování grafových dat ) a zahrnuje funkce extrakce, transformace, načítání (ETL) i aplikační server .

Dějiny

Během počátečního vývoje SAP HANA společnost SAP SE vyvinula nebo získala řadu technologií . Tito zahrnovali vyhledávač TREX ( vyhledávač orientovaný na sloupce v paměti ), P * TIME ( platforma pro zpracování transakcí online v paměti (OLTP) získaná společností SAP v roce 2005) a MaxDB s modulem liveCache v paměti.

První významná demonstrace platformy byla v roce 2008: týmy ze SAP SE , Hasso Plattner Institute a Stanford University předvedly aplikační architekturu pro analýzu a agregaci v reálném čase s názvem HYRISE. Bývalý výkonný pracovník SAP SE, Vishal Sikka , zmínil tuto architekturu jako „Hasso's New Architecture“. Před stabilizací názvu „HANA“ lidé odkazovali na tento produkt jako na „novou databázi“. Tento software se dříve nazýval „SAP High-Performance Analytic Appliance“.

První výzkumný dokument o HYRISE byl publikován v listopadu 2010. Výzkumný modul byl později vydán jako open source v roce 2013 a byl znovu navržen v roce 2016, aby se stal HYRISE2 v roce 2017.

První produkt byl dodán koncem listopadu 2010. Do poloviny roku 2011 tato technologie vzbudila zájem, ale zkušenější obchodní zákazníci ji považovali za „v počátcích“. Podpora HANA pro SAP NetWeaver Business Warehouse byla oznámena v září 2011, dostupnost bude k dispozici v listopadu.

V roce 2012 společnost SAP propagovala aspekty cloud computingu . V říjnu 2012 společnost SAP oznámila platformu jako nabídku služeb nazvanou SAP HANA Cloud Platform a variantu nazvanou SAP HANA One, která využívala menší množství paměti.

V květnu 2013 byla oznámena nabídka spravovaného privátního cloudu s názvem HANA Enterprise Cloud service.

V květnu 2013 byla k dispozici Business Suite na HANA, která zákazníkům umožnila spouštět funkce SAP Enterprise Resource Planning na platformě HANA.

S / 4HANA , vydané v roce 2015, napsané speciálně pro platformu HANA, kombinuje funkce pro ERP , CRM , SRM a další do jednoho systému HANA. S / 4HANA má být zjednodušenou obchodní sadou, která nahradí systémy ERP dřívější generace . I když je pravděpodobné, že SAP zaměří své inovace na S / 4HANA, někteří zákazníci používající jiné systémy než HANA vyvolali obavy z toho, že budou uzamčeni do produktů SAP. Vzhledem k tomu, že S / 4HANA vyžaduje ke spuštění systém SAP HANA, zákazníci provozující aplikace SAP business suite na hardwaru, který není certifikován společností SAP, by museli migrovat do databáze HANA certifikované společností SAP, pokud by si vybrali funkce nabízené společností S / 4HANA.

Spíše než vytváření verzí software využívá pro aktualizace aktualizace Service Pack , označované jako Support Package Stacks (SPS). Zásobníky balíčků podpory jsou vydávány každých 6 měsíců.

V listopadu 2016 společnost SAP oznámila SAP HANA 2, která nabízí vylepšení v různých oblastech, jako je správa databází a správa aplikací, a zahrnuje dvě nové cloudové služby: Analýza textu a Analýza pozorování Země. Zákazníci HANA mohou upgradovat na HANA 2 od SPS10 a novějších. Zákazníci, kteří používají SPS9 a nižší, musí nejprve upgradovat na SPS12, než upgradují na HANA 2 SPS01.

Architektura

Přehled

Hlavní rozdíly mezi Hany a předchozí generace systémů SAP je, že se jedná o sloupec orientovaný , v paměti databáze , která kombinuje OLAP a OLTP operací do jednoho systému; SAP HANA je tedy obecně systém OLTAP. Ukládání dat v hlavní paměti spíše než na disk poskytuje rychlejší přístup k datům a rozšířením také rychlejší dotazování a zpracování. Zatímco ukládání dat v paměti poskytuje výhody výkonu, jedná se o nákladnější formu ukládání dat. Při sledování vzorů přístupu k datům může být v podnikovém systému zřídka přistupováno až k 85% dat, proto může být nákladově efektivní ukládat často přístupná nebo „horká“ data do paměti, zatímco méně často přístupná „teplá“ data jsou uložené na disku, přístup, který SAP nazval „Dynamic tiering“.

Systémy orientované na sloupce ukládají všechna data pro jeden sloupec na stejném místě, místo aby ukládali všechna data pro jeden řádek na stejném místě (systémy orientované na řádky). To může umožnit vylepšení výkonu pro dotazy OLAP na velké datové sady a umožňuje větší vertikální kompresi podobných typů dat v jednom sloupci. Pokud jsou časy čtení pro data uložená ve sloupcích dostatečně rychlá, lze konsolidovaná zobrazení dat provádět za běhu , což odstraňuje potřebu udržovat agregovaná zobrazení a přidruženou redundanci dat .

Ačkoli pro OLTP jsou tradičně upřednostňovány řádkově orientované systémy , úložiště v paměti otevírá techniky pro vývoj hybridních systémů vhodných pro funkce OLAP i OLTP , čímž odpadá nutnost udržovat samostatné systémy pro operace OLTP a OLAP.

Komponenty indexeru

Indexový server provádí správu relací, autorizaci, správu transakcí a zpracování příkazů. Databáze má úložiště řádků i sloupcovité úložiště. Uživatelé mohou vytvářet tabulky pomocí libovolného úložiště, ale sloupcový obchod má více funkcí a je nejčastěji používán. Indexový server také spravuje perzistenci mezi obrázky paměti uloženými v mezipaměti databázových objektů, soubory protokolu a soubory trvalého úložiště. Modul XS umožňuje vytváření webových aplikací.

Informační modelování SAP HANA (známé také jako datové modelování SAP HANA) je součástí vývoje aplikací HANA. Modelování je metodika vystavení provozních údajů koncovému uživateli. V procesu modelování se používají opakovaně použitelné virtuální objekty (pojmenované pohledy výpočtu).

MVCC

SAP HANA spravuje souběžnost pomocí multiversního řízení souběžnosti (MVCC), které poskytuje každé transakci snímek databáze v určitém okamžiku. Když databáze MVCC potřebuje aktualizovat položku dat, nepřepíše stará data novými daty, ale místo toho označí stará data jako zastaralá a přidá novější verzi.

Velká data

Ve škálovatelném prostředí může HANA udržovat objemy až petabyte dat v paměti při vrácení výsledků dotazu za sekundu. Paměť RAM je však stále mnohem dražší než místo na disku, takže přístup škálování je proveditelný pouze pro určité časově kritické případy použití.

Analytics

SAP HANA obsahuje řadu analytických modulů pro různé druhy zpracování dat. Knihovna obchodních funkcí obsahuje řadu algoritmů, které jsou k dispozici pro řešení běžných algoritmů zpracování obchodních dat, jako jsou odpisy aktiv , klouzavá předpověď a klouzavý průměr . Knihovna Predictive Analytics obsahuje nativní algoritmy pro výpočet běžných statistických měření v oblastech, jako je shlukování , klasifikace a analýza časových řad .

HANA integruje statistický programovací jazyk R jako podporovaný jazyk v uložených procedurách .

Databáze sloupců úložiště nabízí možnosti databáze grafů . Grafický engine zpracovává Cypher Query Language a má také vizuální manipulaci s grafem pomocí nástroje s názvem Graph Viewer. Datové struktury grafů jsou uloženy přímo v relačních tabulkách v úložišti sloupců HANA. Předem připravené algoritmy v grafickém enginu zahrnují porovnávání vzorů, hledání sousedství, jednu nejkratší cestu a silně propojené komponenty. Typické situace použití pro Graph Engine zahrnují příklady jako sledovatelnost dodavatelského řetězce, detekce podvodů a logistika a plánování tras.

HANA také obsahuje prostorový databázový stroj, který implementuje typy prostorových dat a rozšíření SQL pro operace CRUD na prostorových datech. HANA je certifikována Open Geospatial Consortium a integruje se s geografickým informačním systémem ESRI ArcGIS .

Kromě numerických a statistických algoritmů může HANA provádět textovou analýzu a podnikové textové vyhledávání. Schopnost vyhledávání HANA je založena na „fuzzy“ vyhledávání odolném vůči chybám, podobně jako moderní webové vyhledávače. Výsledky zahrnují statistické měřítko relevantnosti výsledků vyhledávání a kritéria vyhledávání mohou zahrnovat práh přesnosti výsledků. Dostupné analýzy zahrnují identifikaci entit, jako jsou lidé, data, místa, organizace, požadavky, problémy atd. Takovou extrakci entit lze uspokojit pro konkrétní případy použití, jako jsou Hlas zákazníka (preference a očekávání zákazníka), Podnik (tj. Fúze a akvizice, produkty, organizace) a Veřejný sektor (veřejné osoby, události, organizace). Lze také implementovat vlastní extrakci a slovníky.

Vývoj aplikací

Kromě funkcí pro analýzu databází a dat je SAP HANA webovým aplikačním serverem , který hostí aplikace orientované na uživatele úzce integrované s databázovými a analytickými stroji HANA. „XS Advanced Engine“ (XSA) nativně pracuje s jazyky a runtime Node.js a JavaEE . XSA je založen na architektuře Cloud Foundry, a proto podporuje pojem „Bring Your Own Language“, což umožňuje vývojářům vyvíjet a nasazovat aplikace napsané v jazycích a v jiných běhových obdobích, než jsou ty, které implementuje XSA nativně, stejně jako nasazení aplikací jako mikroslužeb . XSA také umožňuje JavaScript na straně serveru (XSJS).

Podpora aplikačního serveru je sada nástrojů pro správu životního cyklu aplikace, která umožňuje vývojové nasazení a monitorování aplikací orientovaných na uživatele.

Rozvinutí

HANA lze nasadit místně nebo v cloudu od řady poskytovatelů cloudových služeb .

HANA lze nasadit místně jako nové zařízení od certifikovaného dodavatele hardwaru. Alternativně lze jako součást implementace použít stávající hardwarové komponenty, jako jsou úložiště a síť, což je přístup, který SAP nazývá „Tailored Data Center Integration (TDI)“. HANA je certifikována pro provoz na více operačních systémech, včetně SUSE Linux Enterprise Server a Red Hat Enterprise Linux . Mezi podporované hardwarové platformy pro místní nasazení patří Intel 64 a POWER Systems . Systém je navržen tak, aby podporoval horizontální i vertikální změnu měřítka .

Více poskytovatelů cloudu nabízí SAP HANA na bázi Infrastructure as a Service , včetně:

Společnost SAP také nabízí své vlastní cloudové služby ve formě:

Edice

Licencování SAP HANA je primárně rozděleno do dvou kategorií.

Runtime licence:

Používá se ke spouštění aplikací SAP, jako je SAP Business Warehouse využívající SAP HANA a SAP S / 4HANA .

Licence pro plné použití:

Používá se ke spuštění aplikací SAP i jiných než SAP. Toto licencování lze použít k vytváření vlastních aplikací.

Jako součást licence k plnému použití jsou funkce seskupeny jako edice zaměřené na různé případy použití.

  • Base Edition: Poskytuje základní funkce databáze a vývojové nástroje, ale nepodporuje aplikace SAP.
  • Platform Edition: Základní vydání plus prostorová, prediktivní, integrace R serveru, vyhledávání, text, analytika, grafické stroje a další zabalené obchodní knihovny.
  • Enterprise Edition: Platformová edice plus další dodávané komponenty pro některé možnosti načítání dat a rámec pravidel.

Jako další možnosti jsou navíc licencovány funkce, jako je streamování a ETL.

Od 9. března 2017 je SAP HANA k dispozici ve verzi Express ; efektivní verze, která může běžet na laptopech a dalších prostředích s omezenými zdroji. Licence pro SAP HANA, expresní vydání je zdarma, a to i pro produktivní využití až do 32 GB RAM. Lze dokoupit další zvýšení kapacity.

Viz také

Reference

externí odkazy