Sémantická interoperabilita - Semantic interoperability

Sémantická interoperabilita je schopnost počítačových systémů vyměňovat si data s jednoznačným a sdíleným významem. Sémantická interoperabilita je požadavek umožňující strojově vypočítatelnou logiku , odvozování, zjišťování znalostí a federaci dat mezi informačními systémy .

Sémantická interoperabilita se tedy netýká pouze balení dat ( syntaxe ), ale současného přenosu významu s daty ( sémantika ). Toho je dosaženo přidáním dat o datech ( metadata ), propojením každého datového prvku s kontrolovanou, sdílenou slovní zásobou . Význam dat je přenášen se samotnými daty, v jednom samopopisném „ informačním balíčku “, který je nezávislý na jakémkoli informačním systému. Je to tento sdílený slovník a jeho související odkazy na ontologii , která poskytuje základ a schopnost strojové interpretace, odvozování a logiky.

Syntaktická interoperabilita (viz níže ) je předpokladem sémantické interoperability. Syntaktická interoperabilita se týká mechanismů balení a přenosu dat. Ve zdravotnictví se HL7 používá více než třicet let (což předchází technologii internetu a webu) a jako oddělovač dat používá znak potrubí (|). Aktuální internetový standard pro značení dokumentů je XML , který jako oddělovač dat používá „<>“. Oddělovače dat nepředávají datům žádný jiný význam než strukturovat data. Bez datového slovníku k překladu obsahu oddělovačů zůstávají data bezvýznamná. I když existuje mnoho pokusů o vytváření datových slovníků a informačních modelů, které mají být spojeny s těmito mechanismy balení dat, žádný z nich nebyl praktický k implementaci. To jen zachovalo probíhající „babelizaci“ dat a neschopnost vyměňovat si data s významem.

Od zavedení konceptu sémantického webu Timem Bernersem-Leeem v roce 1999 roste zájem a používání standardů W3C (World Wide Web Consortium) o poskytování sémantické výměny dat, federace a inferenčních schopností ve webovém měřítku.

Sémantika jako funkce syntaktické interoperability

Syntaktická interoperabilita poskytovaná například standardy XML nebo SQL je předpokladem sémantiky. Zahrnuje společný datový formát a společný protokol pro strukturování jakýchkoli dat tak, aby způsob zpracování informací byl ze struktury interpretovatelný. Umožňuje také detekci syntaktických chyb, což umožňuje přijímajícím systémům požadovat opětovné odeslání jakékoli zprávy, která se zdá být zkomolená nebo neúplná. Pokud je syntaxe zkomolená nebo nemůže reprezentovat data, není možná žádná sémantická komunikace . Informace reprezentované v jedné syntaxi však mohou být v některých případech přesně přeloženy do jiné syntaxe. Tam, kde je možný přesný překlad syntaxí, mohou systémy využívající různé syntaxe také přesně spolupracovat. V některých případech může být schopnost přesně překládat informace mezi systémy pomocí různých syntaxí omezena na jeden směr, když použité formalismy mají různé úrovně expresivity (schopnost vyjadřovat informace).

Jedna ontologie obsahující reprezentace každého výrazu používaného v každé aplikaci je obecně považována za nemožnou, kvůli rychlému vytváření nových termínů nebo přiřazování nových významů starým termínům. Ačkoli je nemožné předvídat každý koncept, který si uživatel může přát reprezentovat v počítači, existuje možnost najít nějakou konečnou sadu „primitivních“ konceptů, které lze kombinovat a vytvořit tak konkrétnější pojmy, které uživatelé může vyžadovat jakoukoli danou sadu aplikací nebo ontologií. Mít základovou ontologii (nazývanou také horní ontologie ), která obsahuje všechny tyto primitivní prvky, by poskytlo spolehlivý základ pro obecnou sémantickou interoperabilitu a umožnilo uživatelům definovat jakékoli nové termíny, které potřebují, pomocí základního inventáře prvků ontologie a stále mít tyto nově definované termíny správně interpretované jakýmkoli jiným počítačovým systémem, který může interpretovat základní základovou ontologii. Zda je počet těchto primitivních koncepčních reprezentací ve skutečnosti konečný, nebo se bude rozšiřovat na neurčito, je otázkou aktivního vyšetřování. Pokud je konečný, pak se stabilní základová ontologie vhodná pro podporu přesné a obecné sémantické interoperability může vyvinout poté, co byla některá počáteční základová ontologie testována a používána širokou škálou uživatelů. V současné době široká komunita nepřijala žádnou základovou ontologii, takže taková stabilní základová ontologie je stále v budoucnosti.

Slova a významy

Jedno trvalé přetrvávající nedorozumění, které se opakuje v diskusi o sémantice, je „záměna slov a významů“. Významy slov se mění, někdy rychle. Ale formální jazyk , jako je použit v ontologii může kódovat stejný význam (sémantika) pojmů ve formě, která se nemění. Aby bylo možné určit, jaký je význam konkrétního slova (nebo například výrazu v databázi ), je nutné označit každou fixní reprezentaci pojmu v ontologii slovem nebo výrazy, která se na něj mohou vztahovat pojem. Pokud více slov odkazuje na stejný (pevný) koncept v jazyce, nazývá se to synonymie ; když se jedno slovo používá k označení více než jednoho konceptu, nazývá se to nejednoznačnost .

Nejednoznačnost a synonymie patří mezi faktory, které velmi ztěžují počítačové porozumění jazyku. Používání slov k označení pojmů (významů použitých slov) je velmi citlivé na kontext a účel jakéhokoli použití mnoha výrazů čitelných pro člověka. Použití ontologií při podpoře sémantické interoperability má poskytnout pevný soubor konceptů, jejichž významy a vztahy jsou stabilní a mohou s nimi uživatelé souhlasit. Úkol určit, ve kterých kontextech (každá databáze má jiný kontext), je pak oddělen od úkolu vytvoření ontologie a musí být převzat návrhářem databáze nebo návrhářem formuláře pro zadávání dat , nebo vývojář programu pro porozumění jazykům. Když se změní význam slova použitého v nějakém interoperabilním kontextu, pak je pro zachování interoperability nutné změnit ukazatel na prvky nebo prvky ontologie, které specifikují význam tohoto slova.

Požadavky na reprezentaci znalostí a jazyky

Znalostní reprezentační jazyk může být dostatečně expresivní, aby popsal významové nuance v dobře srozumitelných oblastech. Existuje nejméně pět úrovní jejich složitosti.

Pro obecná polostrukturovaná data lze použít obecný jazyk, jako je XML.

Pro mnoho úkolů mohou být vyžadovány jazyky s plnou silou predikátové logiky prvního řádu .

Lidské jazyky jsou vysoce expresivní, ale jsou považovány za příliš nejednoznačné na to, aby umožnily přesnou interpretaci požadovanou vzhledem k současné úrovni technologie lidského jazyka.

Předchozí domluva není nutná

Sémantickou interoperabilitu lze odlišit od jiných forem interoperability tím, že vezmeme v úvahu, zda přenesené informace mají ve své sdělované podobě veškerý význam požadovaný pro přijímací systém, aby je správně interpretoval, i když jsou algoritmy používané přijímacím systémem neznámé odesílací systém. Zvažte odeslání jednoho čísla:

Pokud je toto číslo zamýšleno jako částka peněz, které dluží jedna společnost druhé společnosti, znamená to nějakou akci nebo nečinnost jak ze strany těch, kdo ji posílají, tak těch, kteří ji dostávají.

Může být správně interpretováno, pokud je odesláno jako odpověď na konkrétní žádost a přijato včas a v očekávané formě. Tato správná interpretace nezávisí pouze na čísle samotném, které by mohlo představovat téměř jakýkoli z miliónů typů kvantitativního měření, spíše závisí přísně na okolnostech přenosu. To znamená, že interpretace závisí na obou systémech, které očekávají, že algoritmy v jiném systému použijí číslo v přesně stejném smyslu, a dále závisí na celé obálce přenosů, které předcházely skutečnému přenosu holého čísla.

Naopak pokud přenosový systém neví, jak budou informace použity jinými systémy, je nutné mít společnou dohodu o tom, jak se v komunikaci objeví informace s určitým konkrétním významem (z mnoha možných významů). Pro konkrétní úkol je jedním řešením standardizace formuláře, například žádosti o platbu; tato žádost by musela standardizovaným způsobem zakódovat všechny informace potřebné k jejímu vyhodnocení, například: agent dlužící peníze, agent dluží peníze, povaha jednání, které vede k dluhu, agenti, zboží , služby a další účastníci této akce; čas akce; dlužná částka a měna, ve které se dluh počítá; čas povolený k platbě; požadovaná forma platby; a další informace. Když se dva nebo více systémů dohodly, jak interpretovat informace v takovém požadavku, mohou dosáhnout sémantické interoperability pro tento konkrétní typ transakce . Pro sémantickou interoperabilitu je obecně nutné poskytnout standardizované způsoby, jak popsat významy mnohem více věcí než jen obchodních transakcí, a počet konceptů, jejichž reprezentaci je třeba odsouhlasit, je minimálně několik tisíc.

Ontologický výzkum

Jak dosáhnout sémantické interoperability pro více než několik omezených scénářů, je v současné době věcí výzkumu a diskuse. Pro problém obecné sémantické interoperability je vyžadována nějaká forma základové ontologie („ horní ontologie “), která je dostatečně komplexní, aby poskytla definici pojmů pro specializovanější ontologie ve více doménách. Za poslední desetiletí bylo vyvinuto více než deset základových ontologií, ale žádná dosud nebyla přijata širokou uživatelskou základnou.

Potřebě jediné komplexní all-inclusive ontologie na podporu sémantické interoperability lze předejít tím, že společnou základovou ontologii navrhneme jako soubor základních („primitivních“) konceptů, které lze kombinovat a vytvořit logické popisy významů termínů používaných v ontologie lokální domény nebo lokální databáze. Tato taktika je založena na zásadě, že:

Li:

(1) jsou dohodnuty významy a použití primitivních prvků ontologie v základové ontologii a 
(2) prvky ontologie v doménových ontologiích jsou konstruovány jako logické kombinace prvků v základové ontologii,

Pak:

Zamýšlené významy elementů ontologie domény lze vypočítat automaticky pomocí FOL (logiky prvního řádu), jakýmkoli systémem, který akceptuje významy prvků v základové ontologii a má jak základovou ontologii, tak logické specifikace prvky v ontologii domény.

Proto:

Jakýkoli systém, který chce přesně spolupracovat s jiným systémem, musí přenášet pouze data, která mají být sdělena, plus jakékoli logické popisy termínů použitých v těchto datech, které byly vytvořeny lokálně a nejsou již ve společné základové ontologii.

Tato taktika pak omezuje potřebu předchozí shody na významech pouze na ontologické prvky ve společné Foundation Ontology (FO). Na základě několika úvah to může vyžadovat méně než 10 000 prvků (typů a vztahů). Pro snazší pochopení a použití však může více prvků ontologie s dalšími detaily a specifiky pomoci najít přesné umístění ve FO, kde lze nalézt nebo přidat konkrétní koncepty domény.

V praxi bude pravděpodobně společně s FO zaměřeným na reprezentace primitivních konceptů pravděpodobně také použita sada ontologií rozšíření domény k FO s prvky specifikovanými pomocí prvků FO. Taková již existující rozšíření sníží náklady na vytváření ontologií domény poskytováním stávajících prvků s požadovaným významem a sníží pravděpodobnost chyby použitím prvků, které již byly testovány. Ontologie rozšíření domény mohou být logicky navzájem nekonzistentní a to je třeba určit, pokud se v jakékoli komunikaci používají různá rozšíření domény.

Zkoumá se také, zda je možné použití takovéto jediné základové ontologie zamezit sofistikovanými mapovacími technikami mezi nezávisle vyvinutými ontologiemi.

Důležitost

Praktický význam sémantické interoperability byl změřen několika studiemi, které odhadují náklady (při ztrátě účinnosti) kvůli nedostatku sémantické interoperability. Jedna studie, zaměřená na ztracenou efektivitu při sdělování zdravotnických informací, odhadovala, že zavedením účinného standardu interoperability v této oblasti lze ušetřit 77,8 miliardy USD ročně. Další studie ze stavebního průmyslu a dodavatelského řetězce výroby automobilů odhadují náklady přes 10 miliard USD ročně kvůli nedostatečné sémantické interoperabilitě v těchto průmyslových odvětvích. Celkem lze tato čísla extrapolovat, což naznačuje, že více než 100 miliard USD ročně je ztraceno kvůli nedostatku široce používaného standardu sémantické interoperability pouze v USA.

Dosud nebyla provedena studie o každé oblasti politiky, která by mohla nabídnout velké úspory nákladů při použití standardů sémantické interoperability. Chcete -li však zjistit, která pole politik mohou těžit ze sémantické interoperability, podívejte se obecně na „ Interoperabilitu “. Takovými oblastmi politiky jsou eGovernment , zdraví, bezpečnost a mnoho dalších. V červnu 2007 zřídila EU také Centrum sémantické interoperability Evropa .

Sémantická interoperabilita pro internet věcí

Digitální transformace přináší obrovské výhody, protože umožňuje organizacím být efektivnější, flexibilnější a pohotovější v reakci na změny obchodních a provozních podmínek. To zahrnuje potřebu integrovat heterogenní data a služby v rámci organizací. Sémantická interoperabilita řeší potřebu sdíleného porozumění významu a kontextu.

Abychom to podpořili, skupina odborníků napříč organizacemi zahrnující ISO/IEC JTC1, ETSI, oneM2M a W3C spolupracuje s AIOTI na urychlení zavádění sémantických technologií do IoT. Skupina nedávno vydala dvě společné bílé knihy o sémantické interoperabilitě s názvem „Sémantická řešení IoT - perspektiva vývojářů“ a „Směrem k standardům sémantické interoperability založeným na ontologiích“. Navazuje to na úspěch dřívější bílé knihy „Sémantická interoperabilita pro web věcí“.


Zdroj:

„Sémantická řešení IoT - perspektiva vývojářů“

„Směrem k standardům sémantické interoperability založeným na ontologiích“.

Navazuje to na úspěch dřívější bílé knihy „Sémantická interoperabilita pro web věcí“.

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability- cílení-vývojáři-a-standardizační-inženýři/

Viz také

Reference

externí odkazy