Standard metadat - Metadata standard

Standardní metadata je požadavek, který je určen k vytvoření společného porozumění významu nebo sémantiky z údajů , aby bylo zajištěno správné a správné používání a interpretace dat o jeho majitelů a uživatelů. K dosažení tohoto společného porozumění je třeba definovat řadu charakteristik nebo atributů dat, známých také jako metadata .

Metadata

Metadata jsou často definována jako data o datech . Jsou to „strukturované informace, které popisují, vysvětlují, vyhledávají nebo jinak usnadňují vyhledávání, používání nebo správu informačního zdroje“, zejména v distribuovaném síťovém prostředí, jako je například internet nebo organizace. Dobrým příkladem metadat je katalogizační systém nacházející se v knihovnách , který zaznamenává například autora, název, předmět a umístění na polici zdroje. Další je extrakce znalostí softwarových systémů softwarových objektů, jako jsou toky dat, řídicí toky, mapy hovorů, architektury, obchodní pravidla, obchodní podmínky a schémata databází.

Metadata jsou obvykle rozdělena do tří typů:

  • Popisná metadata popisují informační zdroj pro identifikaci a vyhledávání prostřednictvím prvků, jako je název, autor a abstrakt.
  • Strukturální metadata dokumentují vztahy uvnitř objektů a mezi nimi prostřednictvím prvků, jako jsou odkazy na jiné komponenty (např. Jak jsou stránky sestavovány tak, aby vytvářely kapitoly).
  • Administrativní metadata pomáhají spravovat informační zdroje prostřednictvím prvků, jako je číslo verze, datum archivace a další technické informace pro účely správy souborů, správy práv a zachování.

Dostupné standardy metadat

Prvky metadat seskupené do sad určených pro určitý účel, např. Pro konkrétní doménu nebo určitý typ informačního zdroje, se nazývají schémata metadat. U každého prvku je uvedeno jméno a sémantika (význam prvku). Volitelně lze specifikovat pravidla obsahu (jak musí být formulován obsah), pravidla reprezentace (např. Pravidla pro psaní velkých písmen) a povolené hodnoty prvků (např. Z kontrolované slovní zásoby). Některá schémata také specifikují, ve které syntaxi musí být prvky kódovány, na rozdíl od schémat nezávislých na syntaxi. Mnoho současných schémat používá k určení syntaxe standardní generalizovaný značkovací jazyk (SGML) nebo XML . Schémata metadat, která jsou vyvíjena a udržována standardními organizacemi (jako je ISO ) nebo organizacemi, které na sebe vzaly takovou odpovědnost (jako je iniciativa Dublin Core Metadata Initiative), se nazývají standardy metadat.

Mnoho různých schémat metadat se vyvíjí jako standardy napříč obory, jako je knihovnictví, vzdělávání, archivnictví, elektronický obchod a umění. V níže uvedené tabulce je uveden přehled dostupných standardů metadat.

název Soustředit se Popis
DDI Archivace a sociální vědy Iniciativa pro dokumentaci dat je mezinárodní úsilí o vytvoření standardu pro technickou dokumentaci popisující data ze společenských věd. Aliance založená na členství vyvíjí specifikaci DDI, která je napsána v XML.
EBUCore Sada metadat EBUCore pro audiovizuální obsah EBUCore je soubor popisných a technických metadat založený na dublinském jádru a přizpůsobený médiím. EBUCore je vlajkovou lodí metadatové specifikace EBU, největšího profesního sdružení provozovatelů vysílání na celém světě. Je vyvíjen a udržován technickým oddělením EBU. EBU má dlouhou historii v definici řešení metadat pro provozovatele vysílání. EBUCore je do značné míry používán, jak ukazuje tato zpráva. EBUCore je registrován v SMPTE. Je také k dispozici v RDF.
EBU CCDM Koncepční datový model třídy EBU - CCDM EBCD Class Conceptual Data Model (CCDM) je ontologie definující základní sadu tříd a vlastností jako společný slovník pro popis programů v jejich různých fázích tvorby od uvedení do provozu až po dodání. CCDM je společný rámec a uživatelé jsou vyzváni, aby model dále obohatili o třídy a vlastnosti, které přesněji odpovídají jejich potřebám.
FOAF Přítel přítele (FOAF) Projekt Friend of a Friend (FOAF) je o vytvoření pavučiny strojově čitelných domovských stránek popisujících lidi, vazby mezi nimi a věcmi, které vytvářejí a dělají.
EAD Archivace Encoded Archival Description je standard pro kódování archivních vyhledávacích pomůcek pomocí XML v archivních a rukopisných úložištích.
CDWA Umění Kategorie pro popis uměleckých děl je koncepční rámec pro popis a přístup k informacím o uměleckých dílech, architektuře a další materiální kultuře.
VRA jádro Umění Asociace vizuálních zdrojů poskytuje kategorickou organizaci pro popis děl vizuální kultury i obrázků, které je dokumentují.
Darwinovo jádro Biologie Darwin Jádro je metadata specifikace pro informace o geografickém výskytu druhů a existence vzorků ve sbírkách.
ONIX Knižní průmysl Online Information Exchange je mezinárodní standard pro reprezentaci a sdělování informací o produktech knižního průmyslu v elektronické podobě.
CWM Skladování dat Hlavním účelem metamodelu Common Warehouse je umožnit snadnou výměnu metadat skladu a business intelligence v distribuovaných heterogenních prostředích.
EML Ekologie Jazyk ekologických metadat je specifikace vyvinutá pro ekologickou disciplínu.
IEEE LOM Vzdělávání Metadata Learning Objects specifikují syntaxi a sémantiku metadat Learning Object.
CSDGM Geografická data Standard obsahu pro digitální geoprostorová metadata spravuje Federal Federal Geographic Data Committee (FGDC).
ISO 19115 Geografická data Zeměpisné informace 2003 - Metadata: ISO 19115 standard definuje, jak popsat geografické informace a přidružené služby, včetně obsahu, časoprostorová nákupy, kvalitu dat, přístupu a práv na používání. Je udržován výborem ISO/TC 211 .
e-GMS Vláda E-Government Metadata Standard (E-GMS) definuje prvky metadat pro informační zdroje s cílem zajistit maximální soulad metadat napříč organizací veřejného sektoru ve Velké Británii.
GILS Vláda/organizace Služba Global Information Locator definuje otevřený, levný a škálovatelný standard, aby vlády, společnosti nebo jiné organizace mohly pomoci vyhledávačům najít informace.
TEI Humanitní vědy, sociální vědy a lingvistika Iniciativa kódování textu je standardem pro reprezentaci textů v digitální podobě, zejména v humanitních, sociálních a lingvistických oborech.
NISO MIX snímky Z39.87 Datový slovník je technická metadata pro digitální statické obrázky (MIX) - NISO metadata pro obrázky v XML je schéma XML pro sadu prvků technických dat potřebných pro správu sbírek digitálních obrázků.
<indexy> Duševní vlastnictví Obsahový model Indecs -Interoperabilita dat v systémech elektronického obchodování řeší potřebu začlenit různé identifikátory tvorby a metadata do rámce na podporu správy práv duševního vlastnictví.
MARC Knihovnictví MARC - MAchine Readable Cataloging - standardy pro reprezentaci a komunikaci bibliografických a souvisejících informací ve strojově čitelné formě.
METS Knihovnictví Metadata Encoding and Transmission Standard je schéma XML pro kódování popisných, administrativních a strukturálních metadat týkajících se objektů v digitální knihovně.
MODY Knihovnictví Metadata Popis objektu Schéma je schéma sady bibliografických prvků, které lze použít pro různé účely, a zejména pro knihovní aplikace.
XOBIS Knihovnictví XML Organic Bibliographic Information Schema je schéma XML pro modelování dat MARC.
PBCore Média PBCore je metadata a katalogizační zdroj pro veřejnoprávní stanice a přidružené komunity.
MPEG-7 Multimédia Rozhraní popisu multimediálního obsahu MPEG-7 je standardem ISO/IEC a specifikuje sadu deskriptorů k popisu různých typů multimediálních informací; je vyvinut skupinou Moving Picture Experts Group.
Hudební notace Music Encoding Initiative je snahou komunity vytvořit obecně přijímanou, digitální, symbolickou reprezentaci dokumentů notového záznamu.
Dublinské jádro Síťové zdroje Dublin Core - interoperabilní online standard metadat zaměřený na síťové zdroje.
DOI Síťové zdroje Digital Object Identifier poskytuje systém pro identifikaci a tím i správu informací („obsahu“) v digitálních sítích, zajišťující stálost a sémantickou interoperabilitu.
ISO/IEC 11179 Organizace Norma ISO/IEC 11179 popisuje metadata a činnosti potřebné ke správě datových prvků v registru za účelem vytvoření společného chápání dat napříč organizačními prvky a mezi organizacemi.
ISO/IEC 19506 Softwarové systémy Norma ISO/IEC 19506 s názvem Knowledge Discovery Metamodel je ontologie pro popis softwarových systémů. Standard poskytuje detailní ontologii i společný datový formát pro reprezentaci granulárních softwarových objektů a jejich vztahů, což umožňuje extrakce, jako jsou datové toky, řídicí toky, mapy hovorů, architektura, databázová schémata, obchodní pravidla/termíny a odvozování obchodních procesů. Používá se především pro zabezpečení, dodržování předpisů a modernizaci starších a stávajících systémů.
ISO 23081 Správa záznamů ISO 23081 je třídílná technická specifikace definující metadata potřebná ke správě záznamů. Část 1 se zabývá zásadami, část 2 se zabývá koncepčními a implementačními problémy a část 3 popisuje metodu sebehodnocení.
MoReq2010 Správa záznamů MoReq2010 je specifikace popisující MOdel REQuirements pro správu elektronických záznamů.
DIF Vědecké soubory dat Directory Interchange Format je popisný a standardizovaný formát pro výměnu informací o sadách vědeckých dat.
RAD Knihovnictví a archivace Tyto Pravidla pro archivní popis (RAD) je kanadský archivní popisné standardem. Dohlíží na něj Kanadský výbor pro archivní popis Kanadské rady archivů. Podobně strukturovaný jako AACR2 byl naposledy revidován v roce 2008.
RDF Webové zdroje Resource Description Framework (RDF) je obecná metoda pro koncepční popis nebo modelování informací, která je implementována ve webových zdrojích, pomocí různých formátů syntaxe.
MDDL Finanční trh (Financial) Market Data Definition Language (MDDL) byl vyvinut Divizí finančních informačních služeb (FISD) Asociace softwarového a informačního průmyslu (SIIA). MDDL je rozšiřitelná specifikace odvozená od jazyka Markup Language (XML), která usnadňuje výměnu informací o finančních nástrojích používaných na světových finančních trzích. MDDL pomáhá při mapování všech tržních dat do společného jazyka a struktury, což usnadňuje výměnu a zpracování více komplexních datových sad.
NIEM Vymáhání práva ; Sociální služby ; Plánování podnikových zdrojů NIEM-model národní výměny informací -je komunitní přístup k výměně informací založený na vládě USA a založený na standardech. Datové domény NIEM rostou standardy vyvinuté a udržované komunitními doménami. Některé vzorové domény zahrnuté nebo vyvíjené v NIEM jsou: chemie/biologie/záření/nukleární; spravedlnost; inteligence; přistěhovalectví; mezinárodní obchod; biometrie; nouzové řízení; promítání; lidské služby; služby pro děti, mládež a rodinu; zdraví; ochrana infrastruktury; vojenské operace; námořní; a povrchovou dopravu.
SAML Shibboleth byl vyvinut společností Internet2/MACE. Poskytuje metodu distribuované autentizace a autorizace pro zúčastněné aplikace založené na HTTP (S). Security Assertion Markup Language je otevřený datový formát založený na XML pro výměnu autentizačních a autorizačních dat mezi stranami. Příklad schématu lze nalézt na OASIS (Pokrok v otevřených standardech pro informační společnost)

Prameny:

Viz také

Reference