Astrofyzikální datový systém - Astrophysics Data System

Astrofyzikální datový systém
Logo ADS.png
Logo REKLAM
Výrobce Harvard – Smithsonian Center for Astrophysics for the National Aeronautics and Space Administration (USA)
Dějiny 1992 předložit
Přístup
Náklady Volný, uvolnit
Dosah
Disciplíny Astronomie a fyzika
Zaznamenejte hloubku Rejstřík, abstrakt a plný text
Geoprostorové pokrytí Celosvětově
Odkazy
webová stránka http://www.adsabs.harvard.edu/

Astrophysics Data System ( ADS ) je online databáze více než osm milionů astronomie a fyziky papíry z obou recenzované a non-recenzovaných odborných zdrojů. Abstrakty jsou k dispozici online téměř u všech článků a plně naskenované články jsou k dispozici ve formátu Graphics Interchange Format (GIF) a Portable Document Format (PDF) pro starší články. Byl vyvinut Národním úřadem pro letectví a vesmír (NASA) a je řízen Harvard-Smithsonianovým centrem pro astrofyziku .

ADS je výkonný výzkumný nástroj a má významný dopad na efektivitu astronomického výzkumu od jeho spuštění v roce 1992. Vyhledávání literatury, které by dříve trvalo dny nebo týdny, lze nyní provést během několika sekund pomocí vyhledávacího nástroje ADS, což je na míru pro astronomické potřeby. Studie zjistily, že přínos ADS pro astronomii se rovná několika set milionům amerických dolarů ročně a odhaduje se, že systém ztrojnásobil počet čtenářů astronomických časopisů.

Využívání ADS je mezi astronomy po celém světě téměř univerzální, a proto lze statistiku využití ADS použít k analýze globálních trendů v astronomickém výzkumu. Tyto studie odhalily, že rozsah výzkumu, který astronom provádí, souvisí s hrubým domácím produktem (HDP) na obyvatele země, ve které sídlí, a že počet astronomů v zemi je úměrný HDP země, takže celkový objem výzkumu provedeného v zemi je úměrný druhé mocnině jejího HDP děleno její populací.

Dějiny

Po mnoho let rostl problém v astronomickém výzkumu (stejně jako v jiných akademických disciplínách) v tom, že se počet článků publikovaných v hlavních astronomických časopisech neustále zvyšoval, což znamenalo, že astronomové byli schopni číst stále méně nejnovějších poznatků výzkumu. Během osmdesátých let astronomové viděli, že rodící se technologie, které tvořily základ internetu, by mohly být nakonec použity k vybudování elektronického indexovacího systému astronomických výzkumných prací, který by astronomům umožnil držet krok s mnohem větším rozsahem výzkumu.

První návrh databáze abstraktů časopisů byl podán na konferenci o astronomii z velkých databází, která se konala v Garching bei München v roce 1987. Počáteční vývoj elektronického systému pro přístup k astrofyzikálním abstraktům proběhl během následujících dvou let; v roce 1991 proběhly diskuse o tom, jak integrovat ADS s databází SIMBAD , která obsahuje všechna dostupná katalogová označení pro objekty mimo sluneční soustavu , a vytvořit tak systém, kde by astronomové mohli hledat všechny papíry napsané o daném objektu.

Původní verze ADS s databází sestávající ze 40 článků byla vytvořena jako důkaz koncepce v roce 1988 a databáze ADS byla úspěšně propojena s databází SIMBAD v létě roku 1993. Tvůrci věřili, že toto bylo první použití internet umožňující simultánní dotazování transatlantických vědeckých databází. Do roku 1994 byla služba dostupná prostřednictvím proprietárního síťového softwaru, ale na začátku téhož roku byla převedena do rodící se World Wide Web . Počet uživatelů služby se během pěti týdnů po zavedení webové služby ADS zčtyřnásobil.

Zpočátku byly články v časopisech dostupné prostřednictvím ADS skenovány bitmapy vytvořené z papírových časopisů, ale od roku 1995 začal Astrophysical Journal vydávat on-line vydání, brzy následovaly další hlavní časopisy jako Astronomy and Astrophysics and the Monthly Oznámení Královské astronomické společnosti . ADS poskytla odkazy na tato elektronická vydání od jejich prvního vzhledu. Od roku 1995 se počet uživatelů ADS zdvojnásobil zhruba každé dva roky. ADS má nyní dohody s téměř všemi astronomickými časopisy, které dodávají abstrakty. Naskenované články z počátku 19. století jsou k dispozici prostřednictvím služby, která nyní obsahuje více než osm milionů dokumentů. Služba je distribuována po celém světě s dvanácti zrcadlovými weby ve dvanácti zemích na pěti kontinentech, přičemž databáze je synchronizována prostřednictvím týdenních aktualizací pomocí nástroje rsync , což je zrcadlový nástroj, který umožňuje aktualizace pouze změněných částí databáze. Všechny aktualizace jsou spouštěny centrálně, ale iniciují skripty na zrcadlových webech, které „stahují“ aktualizovaná data z hlavních serverů ADS.

Data v systému

Prostřednictvím ADS je k dispozici 1284 článků o M101 , a to již od roku 1850.

Články jsou indexovány v databázi podle jejich bibliografického záznamu, obsahujícího podrobnosti o časopise, ve kterém byly publikovány, a různá přidružená metadata , jako jsou seznamy autorů, odkazy a citace . Původně byla tato data uložena ve formátu ASCII , ale nakonec tato omezení vedla správce databáze k migraci všech záznamů do formátu XML (Extensible Markup Language) v roce 2000. Bibliografické záznamy jsou nyní uloženy jako prvek XML s dílčími prvky pro různá metadata.

Od příchodu online vydání časopisů se abstrakty načtou do ADS v den zveřejnění článků nebo před datem publikace, přičemž předplatitelům bude k dispozici celý text deníku. Byly naskenovány starší články a pomocí softwaru pro optické rozpoznávání znaků byl vytvořen abstrakt . Naskenované články z doby před rokem 1995 jsou obvykle k dispozici zdarma po dohodě s vydavateli časopisů.

Naskenované články jsou uloženy ve formátu TIFF ve středním i vysokém rozlišení . Soubory TIFF se na vyžádání převádějí na soubory GIF pro prohlížení na obrazovce a soubory PDF nebo PostScript pro tisk. Vygenerované soubory se poté ukládají do mezipaměti, aby se eliminovaly zbytečně časté regenerace populárních článků. Jak 2000, ADS obsahoval 250 GB skenů, které sestávaly z 1 128 955 stránek s články, které obsahovaly 138 789 článků. Do roku 2005 tato částka vzrostla na 650 GB a očekává se její další růst na přibližně 900 GB do roku 2007. Další informace nebyly zveřejněny.

Databáze zpočátku obsahovala pouze astronomické odkazy, ale nyní se rozrostla o tři databáze zahrnující odkazy na astronomii (včetně planetárních a sluneční fyziky), odkazy na fyziku (včetně instrumentace a geověd) a předtisky vědeckých prací z arXiv . Astronomická databáze je zdaleka nejpokročilejší a její použití představuje přibližně 85% celkového využití ADS. Články jsou přiřazeny do různých databází podle tématu, nikoli podle časopisu, ve kterém jsou publikovány, takže články z libovolného jednoho deníku se mohou objevit ve všech třech databázích předmětu. Oddělení databází umožňuje přizpůsobit vyhledávání v každé disciplíně, takže slovům lze při různých vyhledáváních v databázi automaticky přidělit různé váhové funkce v závislosti na tom, jak jsou v příslušném oboru běžné.

Data v archivu předtisků jsou denně aktualizována z arXiv , hlavního úložiště předtisků fyziky a astronomie. Příchod serverů s předtiskem měl, podobně jako ADS, významný dopad na rychlost astronomického výzkumu, protože papíry z serverů s předtiskem jsou často k dispozici týdny nebo měsíce před jejich zveřejněním v časopisech. Začlenění předtisků z arXiv do ADS znamená, že vyhledávač může vrátit nejaktuálnější dostupný výzkum s upozorněním, že předtisky nemusí být peer reviewed nebo korektury požadovaného standardu pro publikaci v hlavních časopisech. Databáze ADS propojuje předtisky s následně publikovanými články, kdykoli je to možné, takže citace a vyhledávání odkazů vrátí odkazy na článek v časopise, kde byl citován předtisk.

Software a hardware

Tento software běží na systému, který byl napsán speciálně pro něj, což umožňuje rozsáhlé přizpůsobení astronomickým potřebám, které by u databázového softwaru pro všeobecné účely nebylo možné . Skripty jsou navrženy tak, aby byly co nejvíce nezávislé na platformě , vzhledem k potřebě usnadnit zrcadlení na různých systémech po celém světě, ačkoli rostoucí používání Linuxu jako operačního systému volby v astronomii vedlo ke zvýšení optimalizace skriptů pro instalaci na tu platformu.

Hlavní server ADS je umístěn v Harvard-Smithsonianově středisku pro astrofyziku v Cambridgi v Massachusetts a jedná se o duální 64bitový server Intel X86 se dvěma čtyřjádrovými procesory 3,0 GHz a 32 GB paměti RAM s distribucí Linux CentOS 5.4 . Zrcadla se nacházejí v Brazílii, Číně, Chile, Francii, Německu, Indii, Indonésii, Japonsku, Rusku, Jižní Koreji, Velké Británii a na Ukrajině.

Indexování

Služba ADS aktuálně přijímá souhrny nebo obsahy z téměř dvou stovek deníkových zdrojů. Služba může přijímat údaje odkazující na stejný článek z více zdrojů a vytvoří jeden bibliografický odkaz na základě nejpřesnějších údajů z každého zdroje. Společné používání TeX a LaTeX téměř ve všech vědeckých časopisech výrazně usnadňuje začlenění bibliografických dat do systému ve standardizovaném formátu a import webových článků s kódem HTML je také jednoduchý. ADS využívá skripty Perl pro import, zpracování a standardizaci bibliografických dat.

Zdánlivě pozemský úkol převést jména autorů na standardní příjmení , počáteční formát je ve skutečnosti jedním z obtížněji automatizovatelných, a to kvůli široké škále konvencí pojmenování po celém světě a možnosti, že křestní jméno, jako je Davis, může být první jméno , prostřední jméno nebo příjmení. Přesná konverze jmen vyžaduje podrobnou znalost jmen autorů aktivních v astronomii a ADS udržuje rozsáhlou databázi jmen autorů, která se také používá při prohledávání databáze (viz níže).

U elektronických článků lze snadno extrahovat seznam odkazů uvedených na konci článku. U skenovaných článků se extrakce odkazů spoléhá na OCR. Referenční databázi lze poté „převrátit“, aby vypsala citace pro každý příspěvek v databázi. Citační seznamy se v minulosti používaly k identifikaci populárních článků chybějících v databázi; většinou to byly před rokem 1975 a nyní byly přidány do systému.

Dosah

Databáze nyní obsahuje více než osm milionů článků. V případě hlavních časopisů o astronomii ( Astrophysical Journal , Astronomical Journal , Astronomy and Astrophysics , Publications of the Astronomical Society of the Pacific and the Monthly Notices of the Royal Astronomical Society ) je pokrytí kompletní a všechna čísla jsou indexována od čísla 1 do současnosti. Tyto časopisy tvoří přibližně dvě třetiny příspěvků v databázi, zbytek tvoří příspěvky publikované ve více než 100 dalších časopisech z celého světa a ve sbornících z konferencí.

I když databáze obsahuje kompletní obsah všech hlavních časopisů a také mnoho menších, pokrytí referencí a citací je mnohem méně úplné. Odkazy a citace článků v hlavních časopisech jsou poměrně úplné, ale odkazy jako „soukromá komunikace“, „v tisku“ nebo „v přípravě“ nelze porovnat a chyby autorů v seznamech referencí také představují potenciální chyby. Astronomické práce mohou být citovány a citovány články v časopisech, které nespadají do působnosti ADS, jako jsou časopisy o chemii , matematice nebo biologii .

Vyhledávač

Příklad komplexního vyhledávání kombinujícího dotazy na objekt, název a abstrakt s filtrem data

Od svého založení vyvinula služba ADS velmi složitý vyhledávací modul pro dotazování abstraktních a objektových databází. Vyhledávací stroj je šitý na míru pro vyhledávání astronomických abstraktů a motor a jeho uživatelské rozhraní předpokládají, že se uživatel dobře orientuje v astronomii a je schopen interpretovat výsledky vyhledávání, které jsou navrženy tak, aby poskytovaly více než jen ty nejdůležitější dokumenty. V databázi lze vyhledávat jména autorů, názvy astronomických objektů , titulní slova a slova v abstraktním textu a výsledky lze filtrovat podle řady kritérií. Funguje to tak, že nejprve shromáždíte synonyma a zjednodušíte vyhledávací termíny, jak je popsáno výše, a poté vygenerujete „invertovaný soubor“, což je seznam všech dokumentů odpovídajících každému hledanému výrazu. Uživatelem vybraná logika a filtry se poté použijí na tento invertovaný seznam, aby se vygenerovaly konečné výsledky hledání.

Dotazy na jméno autora

Systém indexuje jména autorů podle příjmení a iniciál a zohledňuje možné variace pravopisu jmen pomocí seznamu variací. To je běžné v případě jmen, včetně akcentů, jako jsou přehlásky a přepisy z arabského nebo cyrilského písma . Příkladem záznamu v seznamu synonym autorů je:

AFANASJEV, V
AFANASEEV, V
AFANAS'IEV, V
AFANASEV, V
AFANASYEV, V
AFANS'IEV, V
AFANSEV, V

Hledání názvu objektu

Schopnost vyhledávat články na konkrétních astronomických objektech je jedním z nejsilnějších nástrojů ADS. Data systém používá od SIMBAD , v NASA / IPAC extragalaktických databáze , na Mezinárodní astronomické unie oběžníky a Lunar and Planetary Institute identifikovat dokumenty odkazující na daný objekt, a mohou také vyhledávat podle polohy objektu, seznam dokumentů, které se týkají objektů uvnitř 10  poloměrů oblouku daného pravého vzestupu a deklinace . Tyto databáze kombinují mnoho katalogových označení, které by objekt mohl mít, takže při hledání Plejád najdete také dokumenty, které uvádějí slavnou otevřenou hvězdokupu v Býku pod některým z jejích dalších katalogových označení nebo populárních jmen, jako je M45, Sedm sester nebo Melotte 22.

Hledání nadpisů a abstraktů

Vyhledávač nejprve filtruje hledané výrazy několika způsoby. M, za nímž následuje mezera nebo pomlčka, má mezeru nebo pomlčku odstraněnou, takže je hledání objektů katalogu Messier zjednodušeno a uživatelský vstup M45, M 45 nebo M-45 vede k provedení stejného dotazu; podobně označení NGC a běžné vyhledávací termíny jako Shoemaker Levy a T Tauri jsou zbaveny mezer. Nedůležité slova, jako je AT, OR a aby se vynechají, i když v některých případech citlivost případ se udržuje tak, že zatímco nd je ignorován, nd je převeden na „ Andromedae “ a H er se převede na „ Herculis “, ale h er je ignorován.

Nahrazení synonyma

Jakmile jsou hledané výrazy předem zpracovány, je databáze dotazována revidovaným hledaným výrazem a jeho synonymy. Stejně jako jednoduchá náhrada synonym, jako je hledání tvarů v množném a jednotném čísle , vyhledává ADS také velké množství konkrétně astronomických synonym. Například spektrograf a spektroskop mají v zásadě stejný význam a v astronomickém kontextu jsou také metalicita a hojnost synonymem. Seznam synonym ADS byl vytvořen ručně seskupením seznamu slov v databázi podle podobných významů.

Stejně jako synonyma v anglickém jazyce vyhledává ADS také anglické překlady zahraničních hledaných výrazů a naopak, takže hledání francouzského slova soleil načte odkazy na Sun a dokumenty v jiných jazycích než v angličtině mohou být vráceny anglickými hledanými výrazy.

Nahrazení synonyma lze v případě potřeby deaktivovat, aby bylo možné konkrétně vyhledat vzácný výraz, který je synonymem mnohem běžnějšího výrazu (například „ dateline “ místo „ date “).

Logika výběru

Vyhledávací stroj umožňuje logiku výběru v rámci polí i mezi nimi. Hledané výrazy v každém poli lze kombinovat s operátorem OR, AND, jednoduchou logikou nebo logickou logikou a uživatel může určit, která pole se musí ve výsledcích hledání shodovat. To umožňuje vytvářet složitá vyhledávání; uživatel by například mohl vyhledat papíry týkající se NGC 6543 NEBO NGC 7009 , jejichž názvy obsahují (poloměr NEBO rychlost) AND NOT (hojnost NEBO teplota).

Filtrování výsledků

Výsledky vyhledávání lze filtrovat podle řady kritérií, včetně zadání rozsahu let, například „1945 až 1975“, „2000 až do současnosti“ nebo „před 1900“, a v jakém typu časopisu se článek objeví - non - lze recenzované články, jako jsou sborníky z konference, vyloučit nebo konkrétně vyhledat, nebo do vyhledávání zahrnout nebo z něj vyloučit konkrétní časopisy.

Výsledky vyhledávání

Stránka s výsledky vyhledávání z ADS - A, F, G, C, R atd. Jsou odkazy na přidružená data pro každý abstrakt, jako je například plnotextový článek, citace, také dokumenty ke čtení atd.

Ačkoli to bylo koncipováno jako prostředek pro přístup k abstraktům a dokumentům, ADS poskytuje podstatné množství pomocných informací spolu s výsledky vyhledávání. U každého vráceného abstraktu jsou poskytnuty odkazy na další referáty v databázi, na které se odkazuje, a které citují referát, a je poskytnut odkaz na předtisk, pokud existuje. Systém také generuje odkaz na články „také ke čtení“ - tedy k těm, ke kterým měli nejčastěji přístup ti, kdo si článek přečetli. Tímto způsobem může uživatel ADS určit, které papíry jsou nejzajímavější pro astronomy, kteří se zajímají o předmět daného příspěvku.

Vráceny jsou také odkazy na databáze názvů objektů SIMBAD a / nebo NASA Extragalactic Database, pomocí kterých může uživatel rychle zjistit základní pozorovací data o objektech analyzovaných v příspěvku a najít další dokumenty o těchto objektech.

Dopad na astronomii

ADS je téměř univerzálně používán jako výzkumný nástroj mezi astronomy a existuje několik studií, které kvantitativně odhadly, o kolik efektivnější ADS učinila astronomii; jeden odhadoval, že ADS zvýšila efektivitu astronomického výzkumu o 333 ekvivalentních výzkumných let na plný úvazek ročně, a další zjistil, že v roce 2002 byl jeho účinek ekvivalentní 736 výzkumným pracovníkům na plný úvazek, nebo veškerému astronomickému výzkumu prováděnému ve Francii. ADS umožnil, aby vyhledávání literatury, které by dříve trvalo několik dní nebo týdnů, bylo dokončeno během několika sekund, a odhaduje se, že ADS od svého vzniku zvýšil počet čtenářů a využití astronomické literatury zhruba třikrát.

V peněžním vyjádření představuje toto zvýšení efektivity značné množství. Po celém světě je asi 12 000 aktivních astronomických vědců, takže ADS je ekvivalentem asi 5% pracující populace astronomů. Globální rozpočet na astronomický výzkum se odhaduje na 4 000 až 5 000 milionů USD, takže hodnota ADS pro astronomii by byla přibližně 200–250 milionů USD ročně. Jeho provozní rozpočet je malým zlomkem této částky.

Velkou důležitost ADS pro astronomy uznala Organizace spojených národů , jejíž Valné shromáždění ocenilo ADS za její práci a úspěch, zejména ve zprávách Výboru pro mírové mírové akce OSN upozorňuje na její význam pro astronomy v rozvojových zemích. Využití vesmíru . Zpráva hostujícího výboru z roku 2002 v Centru pro astrofyziku mezitím uvedla, že služba „způsobila revoluci ve využívání astronomické literatury“ a byla „pravděpodobně nejcennějším jednotlivým příspěvkem k astronomickému výzkumu, který CfA za svůj život učinila ".

Sociologické studie využívající ADS

Protože ji astronomové používají téměř univerzálně, může služba ADS odhalit mnoho o tom, jak je astronomický výzkum distribuován po celém světě. Většina uživatelů přistupuje k systému z vysokých škol, jejichž IP adresu lze snadno použít k určení geografické polohy uživatele. Studie ukazují, že nejvyššími uživateli ADS na obyvatele jsou astronomové založené na Francii a Nizozemsku , a zatímco rozvinutější země (měřeno HDP na obyvatele ) používají tento systém více než méně rozvinuté země; vztah mezi HDP na obyvatele a používáním ADS není lineární. Rozsah využití ADS na obyvatele daleko přesahuje rozsah HDP na obyvatele a bylo zjištěno, že základní výzkum prováděný v zemi, měřený využitím ADS, je úměrný druhé mocnině HDP země děleno její populací.

Statistiky využití ADS také naznačují, že astronomové ve vyspělejších zemích mají tendenci být produktivnější než ti v méně rozvinutých zemích. Množství provedeného základního výzkumu je úměrné počtu astronomů v zemi vynásobenému HDP na obyvatele. Statistiky také naznačují, že astronomové v evropských kulturách provádějí zhruba třikrát více výzkumu než ti v asijských kulturách , což možná naznačuje kulturní rozdíly v důležitosti přikládané astronomickému výzkumu.

Program ADS byl také použit k prokázání, že podíl astronomických prací s jedním autorem se od roku 1975 podstatně snížil a že astronomické práce s více než 50 autory se od roku 1990 staly běžnějšími.

Viz také

Reference

externí odkazy