EIDR - EIDR

Asociace registru ID zábavy
Logo EIDR 1.png
Formace 2010
Typ 501 (c) (6) nezisková členská společnost
Sídlo společnosti Redwood City, Kalifornie
Výkonný ředitel
Kip Welch
webová stránka www .eidr .org

Entertainment Identifier Registry , nebo EIDR , je globální jedinečný identifikátor systém pro širokou škálu audiovizuálních objektů, včetně filmů , televizních a rozhlasových programů. Identifikační systém řeší identifikátor k metadata záznamu, který je spojen s tituly na nejvyšší úrovni, úpravy, DVD , kódování, klipů a mash-upy . EIDR také poskytuje identifikátory pro poskytovatele video služeb, jako jsou rozhlasové a kabelové sítě.

Od června 2020 obsahuje EIDR více než 2 miliony záznamů, včetně téměř 400 tisíc filmů, a téměř jeden milion epizod z více než 40 000 televizních seriálů.

EIDR je implementace identifikátoru digitálního objektu (DOI).

Dějiny

Systémy identifikace mediálních aktiv existují již desítky let. Běžnou motivací pro jejich vytváření je umožnit správu mediálních aktiv prostřednictvím přiřazení jedinečného ID k sadě metadat představujících charakteristické vlastnosti každého aktiva. Postupem času se tyto systémy obvykle množí a každý z nich má za následek řešení konkrétního souboru problémů. Ve výsledku existují značné rozdíly mezi systémy, pokud jde o to, která aktiva jsou kategorizována, která metadata jsou přidružena ke každému aktivu, a samotná definice aktiva. Abychom jmenovali alespoň několik příkladů, měl by se „ režisérský střih “ filmu lišit od původního uvedení v kinech? Jak by měly být zohledněny regionální rozdíly (např. Překlad názvu nebo dialog do cizích jazyků)? Mezi další komplikace patří postupy (a požadovaná pověření) pro přidávání nových aktiv, úpravy stávajících aktiv a vytváření derivátových aktiv.

EIDR byl vytvořen pro řešení těchto otázek, stejně jako ostatní, s nimiž se setkávají v videosoubor pracovních postupů , a to jak v business-to-business kontext a intramurálních postprodukční činnost producentů obsahu. EIDR má následující vlastnosti:

  • Centrální registr dostupný všem účastníkům
  • Možnost snadné registrace nových aktiv
  • ID aktiva, které je neměnné (a zejména s ohledem na změny ve vlastnictví aktiv nebo umístění metadat nebo samotného aktiva)
  • Detekce / prevence vytváření duplikátů stejného vytvářeného aktiva
  • Schopnost vytvořit soubor videosouborů odvozených z abstraktního díla (např. Původní divadelní vydání, režisérský střih, jazykové varianty)
  • Schopnost seskupovat videopodklady podle obecnějších vztahů (např. Epizody řady televizních seriálů)
  • Základní sada metadat pro odlišení aktiv, i když úzce souvisí
  • Škálovatelné, neměnné, trvalé

EIDR má doplnit, nikoli nahradit stávající systémy identifikace aktiv. Naopak klíčovou funkcí je umožnit záznamu EIDR zahrnout odkazy na ID daného aktiva v jiných systémech. Tato funkce je zvláště užitečná pro filmové a televizní archivy, což jim usnadňuje křížový odkaz na jejich fondy s jinými zdroji díla a metadaty o něm. Podle návrhu EIDR nereplikuje funkce jiných systémů ID aktiv, např. Komerčních systémů, které usilují o přidanou hodnotu prostřednictvím vylepšených metadat (např. Souhrny zápletek, výrobní údaje). Rovněž není cílem sledovat informace o vlastnictví a právech, které však lze implementovat jako aplikace, které používají ID EIDR.

Model obsahu

EIDR je postaveno na kolekci záznamů (které jsou dále rozděleny do polí), které jsou uloženy v centrálním registru. Tyto záznamy jsou externě odkazovány DOI, které jsou přiřazeny při vytvoření záznamu a každý identifikátor je poté neměnný. Systém rozlišení identifikátorů, který je základem DOI, je Handle System, takže každý nativní EIDR Content ID je popisovač naformátovaný, aby se zvýšila specificita, pro zpracování standardů DOI a EIDR.

Formát ID obsahu

Kanonický tvar z EIDR Content ID je instancí kliky a má formát:

10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C

kde

  • 10.5240 je předpona DOI pro dílo EIDR. „10“ označuje, že popisovač je DOI; další předpony jsou přiřazeny jiným typům aktiv (např. akademické publikace ). Číslice mezi znakem „.“ a „/“ tvoří subprefix, který označuje, která agentura pro registraci v rámci Mezinárodní nadace DOI (IDF) má práva ke správě těchto zpracování. „5240“ je přiřazen k asociaci EIDR.
  • XXXX-XXXX-XXXX-XXXX-XXXX-C je přípona DOI. Každé „X“ označuje hexadecimální číslici (AF) a „C“ je kontrolní číslice ISO 7064 Mod 37,36 .

K dispozici je také 96bitová kompaktní binární forma, která je určena pro vkládání do malých užitečných dat, jako jsou vodoznaky . Tento formulář je generován z kanonického formátu následovně:

  • 16bitová subprefix: generováno interpretací subprefixu jako binární hodnoty, např. B'0001010001111000 '
  • 80bitová přípona: část přípony bez kontrolního součtu, představovaná jako 10 bajtů

Formulář Uniform Resource Name pro EIDR ID je uveden v RFC   7302 .

Pro použití na webu může být ID obsahu EIDR reprezentováno jako URI v jedné z těchto forem:

  • https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C : toto je ID EIDR představované jako reference DOI proxy (bude přesměrováno z DOI do registru EIDR)
  • info: doi: 10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C [zastaralé] : toto je ID EIDR představované jako „informační“ URI vyhovující RFC 4452 (pamatujte, že všechna ID EIDR jsou také ID DOI, ale ne konverzovat).

Typy záznamů

Existují čtyři typy záznamů o obsahu, každý spojený s vyhrazenou předponou:

  • ID obsahu (10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C): je spojeno se zábavním aktivem, jako je film nebo televizní seriál. Záznamy obsahu jsou hierarchické, což umožňuje vyjádření vztahů, například Series, jejichž dětmi by byly Seasons, jejichž dětmi by zase byly jednotlivé epizody. Mnoho dalších vztahů je podporováno, jak je popsáno níže. Záznamy obsahu tvoří většinu údajů v registru EIDR.
  • ID strany (10.5237 / XXXX-XXXX): identifikuje subjekty, jako jsou žadatelé o registraci, producenti obsahu a distributoři.
  • ID služby videa (10.5239 / XXXX-XXXX): Identifikuje službu videa, která je hovorově známá jako „kanál“ nebo „síť“: (obvykle) lineární posloupnost obsahu naplánovaného k vysílání ve stanovených časech (např. ID služby pro Cartoon Network je 10.5239 / 8BE5-E3F6). Video služby jsou hierarchické: například rodič může mít několik dětí, aby zohlednil regionální nebo jazykové varianty).
  • ID uživatele (10.5238 / [0-9a-zA-Z _. # ()] {2-32}): Identifikuje uživatele pomocí řetězce 2–32 alfanumerických a vybraných speciálních znaků (zde ilustrováno syntaxí Perlu ). Uživatel je primárně administrativní koncept, který je podřízen Stranám (od nichž zdědí přístupová práva). Na rozdíl od ostatních DOI EIDR lze ID uživatele použít pouze v rámci EIDR (např. Programovací API).

Všechny předpony 5237, 5238, 5239 a 5240 jsou přiřazeny asociaci EIDR.

Záznamy obsahu

Záznamy obsahu jsou objekty kategorizované podle jejich typů a vztahů. Každý z nich má tři různé (ortogonální) druhy písma:

  • Typ objektu : je jich celkem 10. První je základní typ, který má minimální pole nezbytná k popisu záznamu obsahu. Dalších 9 je odvozeno od základního typu a obsahuje další pole pro popis složitějších objektů.
  • Strukturální typ : rozlišují reprezentace díla a jsou uvedeny v rostoucím pořadí specificity:
  • Typ referenta : typ aktiva obsahu, nezávislý na konkrétním projevu (např. Film zobrazený v televizi je stále film):
    • Série : Abstrakce, která obsahuje objednané nebo neuspořádané jednotlivé položky.
    • Sezóna : Druhá úroveň seskupení pod sérií, obvykle pokrývající časový interval
    • TV : Obsah, který se poprvé objevil ve vysílání.
    • Film : Dlouhodobý obsah, který se poprvé objevil v kině nebo divadle.
    • Krátký : Volně definovaný tak, aby zahrnoval práci, která je kratší než 40 minut, jako jsou hudební videa , divadelní týdeníky nebo divadelní nebo DTV kreslené šortky.
    • Web : Obsah, který se poprvé objevil na webu. To se liší od obsahu odjinud, který byl zpřístupněn na webu.
    • Interaktivní materiál : Obsah, který není striktně audiovizuální. Pokrývá DVD nabídky, interaktivní TV překryvy, přizpůsobené přehrávače atd.
    • Kompilace : Obsah složený z několika dalších podkladů, které nelze přesněji popsat, například krabicová filmová franšíza.
    • Doplňkové : Tento typ je pro sekundární obsah, jehož primárním účelem je podpora, rozšiřování nebo propagace jiného obsahu. Mezi příklady patří upoutávky, outtakes a propagační dokumenty („tvorba“).

Základní metadata

Následující pole (převzatá z větší sady) obsahují základní data objektu záznamu obsahu:

  • Strukturální typ : např. Abstrakce
  • Režim : např. AudioVisual (pro film nebo televizní program); „Audio“ pro rozhlasový program; "Vizuální" pro tichou práci.
  • Typ referenta : např. Film
  • Název : primární název. Tituly a alternativní tituly se dále vyznačují:
    • Lang : jazyk názvu vyjádřený jako kód ISO 639-1
    • Třída : vydání nebo regionální
  • Alternativní název 1..N : jeden nebo více alternativních titulů (často regionální nebo jazykové varianty)
  • Původní jazyk : jazyk původního vydání vyjádřený jako kód ISO 639-1
  • Přidružená organizace 1..N : ID strany producenta, studia atd.
  • Datum vydání : datum vydání titulu
  • Země původu : ISO 3166-1 alfa 2 kód, s rozšířeními pro zaniklé země
  • Přibližná délka : vyjádřeno jako XML Schema xs: duration datatype
  • Alternativní ID 1..N : jedno nebo více ekvivalentních ID vyjádřených v jiném systému ID aktiv (viz diskuse níže).
  • Kredity : poskytovány jsou pouze základní kredity, obvykle omezené na režiséra a až čtyři hlavní aktéry. Jak již bylo uvedeno, cílem EIDR není konkurovat proprietárním systémům s bohatými metadaty (např. Souhrny zápletek). Hlavním cílem je pomoci s disambiguací názvu a pomoci s úsilím o ověření a odstranění duplikace.
  • Registrující : strana, která vytvořila tento záznam obsahu (např. „10.5237 / superparty“)
  • Datum vytvoření : datum vytvoření tohoto záznamu obsahu
  • Stav : obvykle „platný“ (pro smazané záznamy existují zvláštní případy)
  • Datum poslední úpravy : poslední změna tohoto záznamu obsahu

Odstraněné záznamy obsahu

ID EIDR musí být vždy rozeznatelné, takže za normálních okolností bude odpovídající záznam obsahu trvalý. K dispozici jsou dva mechanismy pro řešení chyb nebo jiných neobvyklých okolností. Upřednostňovaným je aliasing, kdy je ID EIDR transparentně přesměrováno na jiný záznam obsahu. Aliasing se běžně používá k vypořádání se s aktivem, které je registrováno dvakrát.

Druhým mechanismem je použití záznamů o náhrobcích. Toto se používá, když je poškozený záznam obsahu nebo byla omylem zaregistrována jinak neplatná položka. V tomto případě bude ID přiděleno speciálnímu záznamu náhrobku. Náhrobek může aplikace rozpoznat, protože jeho pole ID EIDR bude nastaveno na rozlišující hodnotu „ 10.5240 / 0000-0000-0000-0000-0000-X “. Všimněte si, že „X“ znamená 24. písmeno latinky ( ASCII 0x58 nebo Unicode U + 0058).

Alternativní ID

Mít bohatou sadu alternativních ID pro obsah je jedním z hlavních cílů EIDR. To umožňuje použití ID EIDR všude v pracovních tocích obsahu; je-li potřeba alternativní ID, najdete jej v metadatech ID EIDR. EIDR podporuje zahrnutí jak proprietárních, tak jiných standardních (např. ISAN) ID referencí. V případě potřeby lze přidat další alternativní ID (např. Strany, které chtějí podporovat nové pracovní postupy). Níže je uveden příklad alternativních ID pro aktivum EIDR 10.5240 / EA73-79D7-1B2B-B378-3A73-M (film Blade Runner ). Pokud je alternativní ID vyřešitelné algoritmicky, například vhodným umístěním do adresy URL šablony, EIDR tento odkaz zpřístupní.

Alternativní ID pro 10.5240 / EA73-79D7-1B2B-B378-3A73-M
Alternativní ID 0000-0000-14A9-0000-K-0000-0000-E
Typ: ISAN
Alternativní ID # 2 89
Typ: IVA
Alternativní ID # 3 B000SW4DLM
Typ: Proprietární doména: amazon.com
Alternativní ID # 4 12886
Typ: Proprietární doména: flixster.com
Alternativní ID # 5 15042
Typ: Proprietární doména: thecinemasource.com
Alternativní ID # 6 tt0083658
Typ: IMDB Vztah: IsSameAs
Alternativní ID # 7 E0087486000
Typ: Proprietární doména: spe.sony.com/MPM
Alternativní ID # 8 3929
Typ: Proprietární doména: spe.sony.com/ProductID
Alternativní ID # 9 2002029
Typ: Proprietární doména: warnerbros.com/MPM
Alternativní ID # 10 389785
Typ: Proprietary Domain veronicamagazine.nl
Alternativní ID # 11 B001EC2J1G
Typ: Proprietární doména: amazon.com
Alternativní ID # 12 150002645
Typ: Proprietární doména: bfi.org.uk

Alternativní ID jsou rozdělena na nechráněné a chráněné. První z nich mají rozlišené předdefinované typy (např. Ty, které vydává ISAN, IMDb a IVA), zatímco proprietární ID jsou typu „Proprietary“ a dále se liší přidruženou doménou DNS. V červenci 2017 jsou prostřednictvím EIDR přímo k dispozici více než 2 miliony alternativních ID.

Vztahy mezi objekty

Objekty obsahu lze vzájemně propojit podle následující tabulky. Tyto vztahy jsou vyjádřeny jako další pole v záznamu obsahu a jsou tedy relativní k danému objektu. Všimněte si, že objekt subjektu je dítě a cíl je rodič (např. Předmět je <relation-type> Of parent). Další omezení jsou uvedena v tabulce.

Vztahy dědičnosti : Objekt, ke kterému vztah existuje, může zdědit základní pole metadat z objektu, na který vztah odkazuje. Na objektu může existovat pouze jeden dědický vztah. Tyto vztahy vytvářejí stromovou strukturu zakořeněnou v EIDR ID pro abstrakci.
isSeasonOf Skupina epizod seriálu vydávaných po souvislou dobu (např. Vysílací rok), např. 10.5240 / AB95-8734-5D98-A282-2DF0-C („Sezóna 9“), je sezóna 10.5240 / C272-DA64-E2B5-0A78 -2AC3-Z („ Akty X“)
isEpisodeOf např. 10.5240 / E008-224D-0397-0560-6300-8 („Sunshine Days“) je epizoda 10.5240 / AB95-8734-5D98-A282-2DF0-C („Sezóna 9“).
isEditOf Instance názvu s jedinečnými vlastnostmi, které jej odlišují od jakékoli jiné verze. Například 10.5240 / 7290-C8AD-12BA-4F93-3B07-7 („Blade Runner: The Director's Cut“) je úpravou 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isManifestationOf Projev je konkrétnější instance díla, která může být prodána, přenesena, přenesena nebo přehrána. Rodičem manifestace by měla být úprava. Například 10.5240 / 9CE1-DE39-5F3E-073D-4307-7 je Ultraviolet Standard CFF (standardní rozlišení, anglický zvuk a titulky) pro „Blade Runner: The Director's Cut“. Jedná se o projev abstraktní práce 10.5240 / EA73-79D7-1B2B-B378-3A73-M .
isClipOf Jeden (a pouze jeden) souvislý fragment aktiva.
Závislostní vztahy : Objekty, na které se vztah vztahuje, mají silný vliv na základní povahu objektu, ke kterému vztah existuje. To znamená, že objekty, na které se odkazuje ve vztahu, musí být brány v úvahu při kontrole duplikátů při vytváření nebo úpravách objektu. Tyto vztahy vytvářejí směrované grafy uvnitř stromů a mezi nimi.
isCompositeOf Jedno dílo složené z částí několika dalších záznamů.
isCompilationOf Soubor několika celých děl, který není přesněji popsatelný.
Lehké vztahy : Neexistuje žádné dědictví; objekty, na které odkazují, nemají vliv na základní povahu objektu, ke kterému vztah existuje. Tyto vztahy se používají především při pohybu uvnitř stromu objektů a vzájemném propojování stromů objektů, čímž se vytváří směrovaný graf napříč prvky těchto stromů.
isPackagingOf Pro vytvoření kolekce aktiv, která jsou uvolněna společně, např. 10.5240 / F219-975E-5990-4570-BA75-2 („Hannah Montana and Miley ...“) je obal 10.5240 / 9ABE-2BF1-ACE7-EBA2-8E57 -N .
isPromotionOf Propagační předměty, například přívěs.
isSupplementTo Doplňkový materiál, který lze najít na DVD, například outtake nebo behind-the-scenes feature.
isAlternateContentFor Obsah synchronizovaný s hlavním prvkem, jako je zvuk nebo alternativní úhel kamery.

Použití ve standardech a aplikacích

EIDR byla začleněna do mnoha standardů. Zde je uvedeno několik těch významnějších:

  • SMPTE / AMWA : SMPTE Recommended Practice RP 2079 standardizuje použití EIDR v mediálních kontejnerech MXF , což je jádrem profesionálních pracovních toků obsahu, včetně specifikací AMWA AS-03 a AS-11. SMTPE Recommended Practice 2021-5 umožňuje přenášení identifikátoru EIDR všude tam, kde se používá BXF pro výměnu dat mezi vysílacími systémy.
  • Evropská vysílací unie (EBU) : EBUCore je běžná základní sada popisných a technických metadat, která popisují mediální zdroje (audio, video, statické obrázky, titulky atd.). Zaměstnanci EBU a EIDR vytvořili mapování EBUCore pro základní záznamy na kořenové objekty EIDR: .. EIDR a EBU spolupracují v pracovní skupině SMPTE Core na definování popisných metadat pro specifikace a pracovní toky založené na SMPTE. EIDR je jedním ze standardů podporovaných jádrem EBU.
  • DVB : Na EIDR se odkazuje v návrhu specifikací DVB pro doprovodné obrazovky (tm-sm-css-0017r14).
  • MPEG : EIDR byl navržen jako identifikátor obsahu ve formátu aplikace Multimedia Preservation, který je definován pro archivní použití.
  • CableLabs (USA) : EIDR je součástí standardu CableLabs Metadata pro distribuci aktiv videa na vyžádání. EIDR je jeden identifikátor programu, který může být přítomen v deskriptoru segmentace SCTE-35 2013, což je standard používaný v IP distribuci přes kabel. EIDR se také používá v produktech Dynamic Ad Insertion (DAI) využívajících standardní architekturu SCTE 130.
  • EIDR a alternativní ID : S cílem podpořit interoperabilitu EIDR s širokou škálou systémů obsahuje EIDR pole „AlternateID“ pro křížové odkazy na stávající systémy ID. Alternativní ID mohou zahrnovat například CRID ( RFC 4078 ), ISAN, ISRC, UPC nebo URI , stejně jako komerční systémy ID, jako je Ad-ID , Baseline, IMDb atd. V současné době přibližně polovina záznamů EIDR obsahuje ID alespoň z jednoho jiného systému.
  • Mapování z jiných standardních metadat a identifikátorů na EIDR : Do systému EIDR lze přímo mapovat další systémy metadat a identifikátorů:
    • EN 15907 a EN 15744 : Tyto normy jsou pod záštitou Evropského výboru pro normalizaci CEN / TC 372 a filmstandards.org. Osvědčené postupy a mapování jsou k dispozici pro kořenové objekty EN 15907 a EN 15744. EIDR také pracuje s filmovými archivy na rozšíření interoperability s těmito standardy na podrobnější úroveň detailů, včetně projektu Britského filmového institutu (BFI) zaregistrovat své záznamy založené na EN 15907 do EIDR.
    • Mezinárodní standardní audiovizuální číslo (ISAN) : ISAN je široce používán v systémech správy práv a sběru. K dispozici je úplné mapování registrace ISAN na registraci EIDR. Agentura pro audiovizuální registraci ve Spojeném království, společný podnik mezi EIDR a ISAN-UK, poskytuje společné registrační služby pro oba identifikátory. Předchůdci této služby se používají k získání ID EIDR a ISAN pro vysílaný obsah od ITV (komerční televizní síť ve Velké Británii).

Identifikátory EIDR si našly cestu do rostoucího počtu komerčních aplikací. Níže jsou uvedeny příklady některých výhod používání EIDR:

  • Integrace Warner Brothers a Xbox : EIDR byla použita ke zlepšení implementace systému Electronic Sell Through (EST) pro doručování divadelních titulů Warner Theatre zákazníkům Microsoft Xbox Live . Provoz elektronického obchodu vyžaduje, aby několik skupin v rámci Warner Brothers koordinovalo své aktivity s týmem Xbox. Odchozí strana distribučního řetězce zahrnovala publikování „Avails“ (tituly k prodeji) a sledování plnění objednávek; příchozí strana zahrnovala zadávání objednávek. Další funkce, jako jsou zprávy, pokrývaly obě strany distribučního řetězce. Původní systém vyžadoval manuální zásah a dohled, zejména na hranicích mezi organizacemi. Příkladem potřeby ručního zpracování by bylo ověření, že byla doručena správná verze díla (která se může lišit v závislosti na titulcích nebo obsahu). V novém systému Warner Brothers vytvořil nové ID EIDR pro každou variantu obsahu a tyto byly použity pro všechny následující fáze zpracování. To eliminovalo nejednoznačnost a usnadnilo automatizaci příchozích a odchozích fází. Další výhodou byla schopnost vytvářet zprávy za běhu.
  • Integrace Swisscom EPG : Swisscom provozuje ve Švýcarsku službu placené televize. V roce 2014 dokončila zavedení elektronického programovacího průvodce (EPG) pro své zákazníky na základě EIDR. Jedná se o systém typu end-to-end, kde se ID EIDR používají k reprezentaci aktiv zobrazených v EPG. Klíčovým prvkem systému bylo, že ID EIDR byla použita také v metadatech průvodce poskytovaných společnosti Swisscom media-press.tv. To zahrnovalo nastavení systému pro přiřazování ID EIDR k aktivům, která ještě nebyla v registru. Klíčovou výhodou používání EIDR není nutnost překládat mezi různými systémy identifikátorů.

Provozní a administrativní

Správu EIDR zajišťuje nezisková asociace EIDR, kterou v říjnu 2010 založily společnosti MovieLabs , CableLabs , Comcast a Rovi . Od té doby se členství neustále rozrůstá: ke konci roku 2014 má 79 členů rozdělených mezi úrovně průmyslových promotérů a průmyslových přispěvatelů. Nejrychleji rostoucí kategorií jsou společnosti mimo USA, které nyní tvoří asi 20% členství. Sdružení EIDR provozuje dva registry EIDR: Production a Sandbox. První je oficiální web a druhý je vyhrazen pro testování a vývoj. Oba systémy jsou veřejně dostupné online, ale není zaručeno, že obsah izolovaného prostoru bude správný, úplný nebo dokonce bude odkazovat na existující aktiva. Registr mohou upravovat pouze členové asociace EIDR.

Registrace

Registraci nových aktiv lze provést jednotlivě nebo hromadně (až 100 000 aktiv najednou). V obou případech pracovní postup zahrnuje kombinaci automatizovaných (pro provádění přesně definovaných, ale zdlouhavých úkolů) a manuálních (kde je vyžadován lidský úsudek) procesů. Je to také iterativní, protože počáteční proces shody může identifikovat různé mezery a chyby, které je třeba řešit.

Registrace nových aktiv je složitý proces, který vyžaduje určitou přípravu, zejména v případě hromadného odeslání. Automatizované procesy zkontrolují syntaxi, ujistí se, že jsou zadána základní metadata a že jsou respektovány všechny závislosti (např. Záznamy sérií vytvořené před epizodami jednotlivých složek). Ruční kroky zahrnují zajištění toho, že k aktivu jsou přidruženy správné strany. Jedním z nejdůležitějších kroků je zajistit, aby nové aktivum již v registru neexistovalo: toto je popsáno v další části.

Aby bylo možné zaregistrovat nové aktivum, musí být uživatel přidružen ke straně, které byla operátorem EIDR udělena role „Registrant“. Žadatelem o registraci může být hlavní agent, jako je studio nebo kódovna, ale může to být také strana provádějící hromadnou registraci položek zpětného katalogu nebo strana jednající jménem někoho jiného. Je rovněž požadováno, aby žadatel o registraci byl členem EIDR. Vlastnictví obsahu, oprávnění k metadatům a registrační schopnost jsou obecně samostatné a nesouvisející pojmy.

Deduplikace

Jedná se o označující aktiva odesílaná do registru, která spadají do jedné z následujících tří kategorií:

  • Kandidátské aktivum je jedinečné (s ohledem na existující aktiva registru).
  • Kandidátské dílo je duplikát existujícího záznamu.
  • Kandidátské aktivum má vysokou pravděpodobnost, že bude duplikátem.

Toto posouzení je založeno na použití (velké) sady pravidel na kandidátské aktivum, což vede k číselnému skóre. Bucketing nastává jako výsledek srovnání skóre se dvěma prahy:

  • Nízká prahová hodnota : jakékoli dílo se skóre pod touto hodnotou se nepovažuje za duplikát. Toto je jediný případ, kdy bude navržené přidání nebo úprava záznamu úspěšné.
  • Vysoká prahová hodnota : jakékoli aktivum se skóre nad touto hodnotou se považuje (téměř jistě) za duplikát. Navrhované přidání / úprava záznamu nebude pokračovat a bude vrácen chybový stav. Žadatelé o registraci budou obecně používat již existující ID pro položku, kterou se pokusili zaregistrovat, a mohou přidat chybějící informace a alternativní ID do existujícího záznamu.

Aktiva spadající mezi nízkou a vysokou prahovou hodnotu se považují za vysoce pravděpodobné, že budou duplikátem: navrhované přidání / úprava záznamu nebude pokračovat, dokud nebude ručně zkontrolován pracovníky EIDR.

Architektura

Níže jsou uvedeny komponenty systému EIDR.

Architektura registru EIDR

Hlavní funkční bloky jsou následující:

  • Core Registry : This module is a customization and configuration of the CNRI Digital Object Repository. Provádí různé funkce včetně registrace, generování jedinečných identifikátorů, indexování, správy úložiště objektů a řízení přístupu.
  • Repository : Toto ukládá a poskytuje přístup k registrovaným objektům; pro EIDR jsou tyto objekty kolekcemi metadat, nikoli samotnými mediálními aktivy. Metadata zahrnují standardní informace o objektu, vztahy a nastavení řízení přístupu.
  • REST AP I: Rozhraní REST, které poskytuje přístup k celé sadě neadministrativních funkcí registru. Služby mohou provádět jednotlivá nebo dávková volání, která lze odesílat synchronně nebo asynchronně. Obecná syntaxe dotazu umožňuje načíst (a v některých případech i upravit) záznamy registru, které splňují sadu kritérií určených volajícím.
    • EIDR SDK : toto je poskytováno vývojářům za účelem usnadnění vytváření aplikací třetích stran (obvykle na podporu B2B nebo intramurálního pracovního toku). Zahrnuje sadu Java SDK, .NET SDK a ukázkové programy postavené na těchto dvou sadách SDK. Použití SDK se doporučuje přes přímá volání rozhraní REST API.
    • Nástroje příkazového řádku : jedná se o jednoduché aplikace Java a .NET, postavené na SDK, z nichž každá poskytuje jednu funkci, jako je řešení, dotaz, shoda a registrace.
    • Webové uživatelské rozhraní : webové uživatelské rozhraní primárně pro vyhledávání, vyhledávání a procházení hierarchie objektů. Podporuje také jednoduché registrace.
  • DOI Proxy : Pomocí předpony úchytky se předávají požadavky na rozlišení EIDR DOI do registru EIDR.
  • Handle System : Poskytuje služby distribuovaného vyhledávání a řešení

Vztah k DOI a Handle System

ID EIDR je specializovaným příkladem identifikátoru digitálního objektu (DOI), který je zase postaven na vrcholu systému rukojetí vyvinutého společností Corporation for National Research Initiatives (CNRI). Níže jsou podrobněji popsány aspekty spodních vrstev specifické pro EIDR.

Digitální identifikátor objektu (aspekty EIDR)

Digitální identifikátor objektu, standardizovaný jako ISO 26324, se snaží jedinečně identifikovat širokou škálu digitálních artefaktů včetně knih, nahrávek, výzkumných dat a dalšího digitálního obsahu. Cílem není jen to, aby ID byla jedinečná, ale trvalá a neměnná. Na rozdíl od adres URL zůstanou identifikátory DOI stejné, i když se objekty přesunou na jiné místo nebo se stanou vlastnictvím jiné organizace. Zde jsou některé z charakteristik DOI:

  • Mezinárodní nadace DOI (IDF) prosazuje dříve dohodnutá pravidla pro jednotlivé registrační agentury (např. EIDR), aby byla zajištěna kontinuita. Zejména pokud RA zastaví činnost, jména, která hostí, převezme jiná RA.
  • IDF definuje pravidla, která musí dodržovat všechny názvy DOI (jaké druhy objektů mohou být pojmenovány konkrétním RA)
  • Systém DOI poskytuje datový model založený na datovém slovníku, který umožňuje strukturovaný způsob vyjadřování metadat (a meziobjektových vztahů).
  • Systém DOI má vlastní vysoce redundantní a distribuovanou sadu serverů handle a proxy.
  • Všechny předpony DOI mají tvar „10.NNNN“, kde 10 je indikátor adresáře a „NNNN“ je kód žadatele o registraci v rozsahu 1-65535 (např. Použití záznamů obsahu EIDR je 10.5240)

Datový model DOI poskytuje prostředky k přidružení metadat ke každému objektu, stejně jako zásady upravující jeho použití. Slovy příručky DOI mohou metadata zahrnovat „jména, identifikátory, popisy, typy, klasifikace, umístění, časy, měření, vztahy a jakýkoli jiný druh informací souvisejících s [objektem].“ Toky metadat mezi následujícími entitami:

  • Poskytovatel zdrojů : obvykle vlastník mediálního aktiva, který je zodpovědný za zadávání metadat do systému.
  • Registrační agentura : subjekty, které slouží jako úložiště aktiv (a souvisejících metadat). Jak již bylo uvedeno, DOI podporuje federaci nezávislých RA, z nichž každá odpovídá za sadu aktiv. EIDR je jedním z takových RA. Mezi další patří CrossRef pro vědecké články, DataCite pro výzkumná data a OPOCE pro oficiální publikace o Evropské unii.
  • Uživatel služby : entity provádějící dotazy na RA načítají metadata spojená s aktivy. Rámec řešení DOI je zodpovědný za odeslání dotazu na příslušnou RA (uživatel služby to nemusí vědět).

Pro podporu interoperability mezi RA má DOI koncept jádra metadat. Toto je základní sada metadat, která by měla mít všechny objekty uložené v rámci DOI. Celá sada je uvedena v příručce DOI. Interoperabilita je velké téma přesahující rámec EIDR, ale následující podmnožina je zvláště relevantní pro aktiva EIDR:

  • referent : objekt udržovaný v systému DOI.
  • referentName : jméno referenta (např. název filmu)
  • primaryReferentType : U EIDR to zahrnuje vytvoření (např. zábavní prostředky) a párty (např. jejich tvůrce).
  • strukturní typ : jedná se o vzájemně se vylučující kategorie, které identifikují formu aktiva. Pro aktiva EIDR jsou zvláště důležité dvě: abstrakce (objekt, jako je film, který může existovat ve více formách) a výkon (konkrétní instance objektu, jako je Director's Cut).
  • principalAgent : u výtvorů subjekt zásadně odpovědný za jeho existenci.
  • registrationAuthorityCode : označuje agenturu, která vydala DOI. Jednalo by se o EIDR RA pro aktiva EIDR.

Metadata EIDR jsou k dispozici ve standardním formátu metadat jádra DOI i ve specifických formátech EIDR. DOI pro schéma metadat DOI je doi: 10.1000 / 276 .

Systém rukojetí (aspekty EIDR)

DOI je zase implementován nad Handle System, distribuovanou, vysoce škálovatelnou službu pro překlad názvů. Popisovač je definován jako:

<Handle> :: = <Handle Naming Authority> "/" <Handle Local Name>

Pojmenovací úřad je globálně jedinečný a definuje administrativní prostor i syntaxi místního názvu manipulace. Pro EIDR ve výše uvedené definici je „10.5240“ EIDR Naming Authority a je zodpovědný za vyřešení přípony (včetně toho, že odpovídá očekávané syntaxi pro aktivum EIDR). Rozsah povolených jmenovacích úřadů je obecnější, než jaký používá DOI (nebo EIDR).

Distribuovaná povaha systému Handle System umožňuje hostování každého místního oboru názvů na více geograficky distribuovaných webech služeb. Toto je federovaný model, kde každý lokální prostor jmen má úplnou kontrolu nad umístěním a provozem svých servisních webů. Kromě toho může každá stránka služby obsahovat více serverů pro rozlišení: požadavky směrované na konkrétní stránku služby budou odesílány rovnoměrně na její základní servery.

Datový model systému rukojetí je jednoduchý, ale flexibilní. S každým popisovačem může být spojen libovolný počet hodnot. V průběhu času mohou být tyto hodnoty vytvářeny, upravovány a ničeny. Každý takový údaj má následující atributy:

  • index : celé číslo bez znaménka, které identifikuje hodnotu dat od ostatních, které mohou pro tento popisovač existovat.
  • typ : řetězec UTF-8 identifikující typ. Systém typů je rozšiřitelný a běžné typy jsou udržovány jako popisovače v pojmenovávací autoritě „0.TYPE“. Neexistují žádná omezení pro vytváření nových typů, ačkoli doporučeným postupem je použití rozlišitelných popisovačů jako názvů typů. Mezi běžné typy patří adresa URL pro jednosměrný adresář, „10320 / loc“ pro sadu alternativ kontextového rozlišení a různé typy správy pro správu systému manipulace, které jsou založeny na rozlišení popisovače.
  • data : samotná hodnota, představovaná jako posloupnost oktetů, které jsou interpretovány v kontextu přidruženého typu
  • oprávnění : přístupová práva k této konkrétní hodnotě. Všimněte si, že různé hodnoty dat popisovače mohou mít různá oprávnění
  • TTL : celé číslo, které určuje, jak dlouho může být hodnota uložena do mezipaměti
  • časové razítko : celé číslo (vyjádřeno v milisekundách z epochy Unixu), které zaznamenává poslední aktualizaci hodnoty
  • reference : seznam odkazů na jiné hodnoty úchytů. Obvykle se používají k přidání pověření (např. Digitální podpis).

Přístup do systému rukojeti se provádí prostřednictvím protokolu drátu definovaného v RFC 3652 ; Aplikace EIDR se tím nemusí zabývat kvůli vrstvení protokolů.

Viz také

Další čtení

  1. R. Kroon, R. Drewry, A. Leigh, S. McConnachie. "Identifikace obsahu pro audiovizuální archivy". International Association of Sound and Audiovisual Archives Journal, léto 2015 (č. 45).
  2. R. Kroon. "Předání objednávky digitálním identifikátorům". Media and Entertainment Journal Winter 2014-2015: 148–150.
  3. R. Drewry, D. Dulchinos. "Transformace zábavy prostřednictvím technologie". Media and Entertainment Journal Winter 2013-2014: 81–88.
  4. D. Agranoff, W. Michel, T. Wakai. "Efektivní integrace a správa metadat obsahu pomocí registru ID zábavy (EIDR)". SCTE Cable-Tec Expo 2012.

externí odkazy

Reference

  1. ^ ISO / IEC 7064: 2003 : Informační technologie - Bezpečnostní techniky - Kontrola znakových systémů. 2002
  2. ^ Schéma XML W3C, část 2: Datové typy, druhé vydání
  3. ^ SMPTE RP 2079 . Název DOI a zastoupení identifikátoru EIDR.
  4. ^ Advanced Media Workflow Association AS-03 MXF Specifikace dodání programu .
  5. ^ Advanced Media Workflow Association AS-11 MFX pro specifikaci příspěvku .
  6. ^ SMPTE RP 2021-5: 2013 . Použití Ad-ID a EIDR jako alternativních identifikátorů v SMPTE BXF a ATSC PMCP.
  7. ^ EBU TECH 3293 . EBU CORE METADATA SET Verze 1.5.
  8. ^ Dokument DVB A167-2. Digitální video vysílání (DVB); Doprovodné obrazovky a streamy; Část 2: Identifikace obsahu a synchronizace médií, červenec 2014. s. 52.
  9. ^ ISO / IEC CD 23000-15 . Informační technologie - Formát multimediální aplikace (MPEG-A) - Část 15: Formát aplikace pro uchování multimédií.
  10. ^ MD-SP-AMIv3.0-I02-121210 Archivovaná 04.2.2015 v Wayback Machine . Specifikace rozhraní CableLabs Asset Management Interface 3.0.
  11. ^ ANSI / SCTE 35 2013 . Cueingová zpráva pro vložení digitálního programu pro kabel.
  12. ^ SCTE 130-10 2013 . Vkládání digitálních programů - Rozhraní reklamních systémů, část 10.
  13. ^ TC 372 Workshop Kompendium . Jak vznikly EN 15744 a EN 15907.
  14. ^ Tisková zpráva . Swisscom dokončuje první evropské nasazení registru Entertainment ID pomocí media-press.tv.
  15. ^ ISO 26324: 2012 : Informace a dokumentace - Systém identifikace digitálních objektů, 2012.