h -index - h-index

H -index je autorem úrovni metrické , že opatření jak na produktivitu a citační impakt z publikací , původně použity pro jednotlivé vědce nebo vědce. Na h -index koreluje se z pochopitelných ukazatele úspěšnosti, například vyhrál Nobelovu cenu , byl přijat studijních pobytů a držení pozic na předních univerzitách. Index je založen na souboru nejcitovanějších vědeckých prací a počtu citací, které obdrželi v jiných publikacích. Index byl v poslední době aplikován na produktivitu a dopad vědeckého časopisu i skupiny vědců, jako je katedra nebo univerzita nebo země. Index navrhl v roce 2005 Jorge E. Hirsch , fyzik z UC San Diego , jako nástroj pro stanovení relativní kvality teoretických fyziků a někdy se mu také říká Hirschův index nebo Hirschovo číslo .

Definice a účel

h -index z grafu počtu citací pro autorem číslované papíry (seřazené v sestupném pořadí)

H -index je definován jako maximální hodnota h tak, že vzhledem k tomu, autor / časopis publikoval alespoň h papíry, které nabízejí vždy po uvedených alespoň h časů. Index je navržen tak, aby zlepšoval jednodušší opatření, jako je celkový počet citací nebo publikací. Index funguje nejlépe při porovnávání vědců pracujících ve stejném oboru, protože citační konvence se mezi různými obory velmi liší.

Výpočet

H-index je největší číslo h, takže h články mají každý alespoň h citací. Pokud má například autor pět publikací s 9, 7, 6, 2 a 1 citací (seřazeno od největší po nejmenší), pak autorův h -index je 3, protože autor má tři publikace se 3 nebo více citacemi . Autor však nemá čtyři publikace se 4 a více citacemi.

Je zřejmé, že autorský h -index může být jen tak velký jako jejich počet publikací. Například autor s pouze jednou publikací může mít maximální h -index 1 (pokud jejich publikace obsahuje 1 nebo více citací). Na druhé straně autor s mnoha publikacemi, z nichž každá má pouze 1 citaci, by měl h -index 1.

Formálně, pokud f je funkce, která odpovídá počtu citací pro každou publikaci, vypočítáme h -index následovně: Nejprve uspořádáme hodnoty f od největší po nejnižší hodnotu. Poté hledáme poslední pozici, ve které je f větší nebo rovno poloze ( této poloze říkáme h ). Pokud například máme výzkumníka s 5 publikacemi A, B, C, D a E s 10, 8, 5, 4 a 3 citacemi, h -index se rovná 4, protože 4. publikace má 4 citace a 5. má pouze 3. Naproti tomu, pokud mají stejné publikace 25, 8, 5, 3 a 3 citace, pak je index 3 (tj. 3. pozice), protože čtvrtý příspěvek má pouze 3 citace.

f (A) = 10, f (B) = 8, f (C) = 5, f (D) = 4, f (E) = 3 → h -index = 4
f (A) = 25, f (B) = 8, f (C) = 5, f (D) = 3, f (E) = 3 → h -index = 3

Pokud máme funkci f seřazenou v sestupném pořadí od největší hodnoty po nejnižší, můžeme h -index vypočítat následovně:

h -index ( f ) =

Hirschův index je analogický Eddingtonovu číslu , dřívější metrice používané pro hodnocení cyklistů. H -index slouží jako alternativa k více tradičním časopise impaktovaných metrik při hodnocení dopadu činnosti konkrétního výzkumného pracovníka. Protože k h -indexu přispívají pouze nejvíce citované články , je jeho určení jednodušší. Hirsch prokázal, že h má vysokou prediktivní hodnotu pro to, zda vědec získal ocenění, jako je členství v Národní akademii nebo Nobelova cena . H -index roste jako citace hromadí, a proto záleží na „ akademickém věku “ výzkumného pracovníka.

Vstupní data

H -index lze ručně určit pomocí citační databází nebo pomocí automatických nástrojů. Databáze založené na předplatném, jako jsou Scopus a Web of Science, poskytují automatické kalkulačky. Od července 2011 Google poskytuje automaticky vypočítaný h -index a i 10 -index ve svém vlastním profilu Google Scholar . Specifické databáze, jako je databáze INSPIRE -HEP, navíc mohou automaticky vypočítat h -index pro výzkumné pracovníky pracující ve fyzice vysokých energií .

Každá databáze pravděpodobně vytvoří jiné h pro stejného učence, kvůli odlišnému pokrytí. Podrobná studie ukázala, že Web of Science má rozsáhlé pokrytí publikací v časopisech, ale slabé pokrytí konferencí s velkým dopadem. Scopus má lepší pokrytí konferencí, ale slabé pokrytí publikací před rokem 1996; Google Scholar má nejlepší pokrytí konferencí a většiny časopisů (i když ne všechny), ale stejně jako Scopus má omezené pokrytí publikací před rokem 1990. Vyloučení příspěvků z konferenčních sborníků je zvláštním problémem vědců z oblasti informatiky , kde jsou sborníky z konferencí považovány za důležitou součást literatury. Google Scholar byl kritizován za produkci „fantomových citací“, včetně šedé literatury v počtu citací, a za nedodržování pravidel booleovské logiky při kombinování hledaných výrazů. Studie Meho a Yang například zjistila, že Google Scholar identifikoval o 53% více citací než Web of Science a Scopus dohromady, ale poznamenal, že protože většina dalších citací uváděných Google Scholar pocházela z časopisů s nízkým dopadem nebo sborníků z konferencí, významně nemění relativní pořadí jednotlivců. Bylo navrženo, že za účelem vypořádání se s někdy širokými odchylkami v h pro jednoho akademika měřenými napříč možnými citačními databázemi by člověk měl předpokládat, že falešné negativy v databázích jsou problematičtější než falešně pozitivní a vzít maximální h naměřené pro akademika .

Příklady

Bylo provedeno jen málo systematického vyšetřování toho, jak se h -index chová v různých institucích, zemích, dobách a akademických oborech. Hirsch navrhl, že pro fyziky může být hodnota h asi 12 typická pro postup do funkce (docent) na velkých [amerických] výzkumných univerzitách. Hodnota asi 18 by mohla znamenat úplné profesorství, 15–20 by mohlo znamenat přátelství v Americké fyzikální společnosti a 45 nebo vyšší by mohlo znamenat členství v Národní akademii věd USA . Hirsch odhadoval, že po 20 letech bude mít „úspěšný vědec“ h -index 20, „vynikající vědec“ bude mít h -index 40 a „skutečně jedinečný“ jedinec bude mít h -index 60.

U nejcitovanějších vědců v období 1983–2002 identifikoval Hirsch top 10 v biologických vědách (v pořadí klesající h ): Solomon H. Snyder , h = 191; David Baltimore , h = 160; Robert C. Gallo , h = 154; Pierre Chambon , H = 153; Bert Vogelstein , h = 151; Salvador Moncada , h = 143; Charles A. Dinarello , H = 138; Tadamitsu Kishimoto , h = 134; Ronald M. Evans , h = 127; a Ralph L. Brinster , h = 126. Mezi 36 novými vyvolenými v Národní akademii věd v biologických a biomedicínských vědách v roce 2005 byl medián h -indexu 57. Hirsch však poznamenal, že hodnoty h se budou u různých oborů lišit.

Mezi 22 vědeckými obory uvedenými v citačních prahech Essential Science Indicators [tedy bez vědeckých akademiků] má fyzika druhou největší citaci po vesmírné vědě. V období od 1. ledna 2000 do 28. února 2010 musel fyzik obdržet 2073 citací, aby patřil mezi nejcitovanější 1% fyziků na světě. Prahová hodnota pro kosmickou vědu je nejvyšší (2236 citací) a na fyziku navazuje klinická medicína (1390) a molekulární biologie a genetika (1229). Většina oborů, jako je životní prostředí/ekologie (390), má méně vědců, méně článků a méně citací. Proto mají tyto obory nižší prahové hodnoty citace v indikátorech základních věd, přičemž nejnižší prahové hodnoty citace jsou pozorovány ve společenských vědách (154), informatice (149) a multidisciplinárních vědách (147).

Čísla se v disciplínách společenských věd velmi liší: Tým Impact of the Social Sciences na London School of Economics zjistil, že sociální vědci ve Spojeném království měli nižší průměrné indexy h . Mezi h -indices pro ( „full“) profesory, založené na Google Scholar údajů pohyboval v rozmezí od 2,8 (v právu), přes 3.4 (politologie), 3,7 (v sociologii), 6,5 (v geografii) a 7,6 (v ekonomii) . Profesor sociálních věd měl v průměru napříč obory h -index přibližně dvakrát vyšší než lektor nebo odborný asistent, i když rozdíl byl nejmenší v geografii.

Výhody

Hirsch zamýšlel h -index řešit hlavní nevýhody ostatních bibliometrických ukazatelů. Metrický celkový počet příspěvků neodpovídá kvalitě vědeckých publikací. Naproti tomu celkový počet metrik citací může být výrazně ovlivněn účastí na jediné publikaci s velkým vlivem (například metodické práce navrhující úspěšné nové techniky, metody nebo aproximace, které mohou generovat velký počet citací). H -index je určena pro měření současně kvalitu i kvantitu vědeckého výstupu.

Kritika

Existuje řada situací, ve kterých h může poskytnout zavádějící informace o výstupu vědce. Některé z těchto selhání nejsou exkluzivní pro h -index, ale jsou sdíleny s jinými metrikami na úrovni autorů .

Zkreslování údajů

H -index nepočítá typického počtu citací v různých oblastech. Citační chování je obecně ovlivněno faktory závislými na poli, které mohou zneplatnit srovnání nejen napříč obory, ale dokonce i v různých oblastech výzkumu jedné disciplíny. Mezi h -index zbavuje informací obsažených ve autor umístění v seznamu autorů, která je v některých vědních oborech je významný, i když v jiných zemích tomu tak není. H -index je přirozené číslo , které snižuje jeho diskriminační sílu. Ruane a Tol proto navrhují racionální h -index, který interpoluje mezi h a h + 1.

Náchylný k manipulaci

Slabé stránky platí pro čistě kvantitativní výpočet vědeckých nebo akademických výstupů. Stejně jako ostatní metriky, které počítají citace, lze i h -index manipulovat donucovací citací , což je praxe, při které redaktor časopisu nutí autory přidávat do svých článků falešné citace, než časopis souhlasí s jeho zveřejněním. S h -indexem lze manipulovat pomocí citací, a pokud jsou založeny na výstupu Google Scholar , lze k tomuto účelu použít dokonce i počítačem generované dokumenty, např. Pomocí SCIgen .

Další nedostatky

V jedné studii bylo zjištěno, že h -index má o něco menší prediktivní přesnost a přesnost než jednodušší měření průměrných citací na papír. Toto zjištění však bylo v rozporu s jinou Hirschovou studií. H -index neposkytuje podstatně přesnější měření dopadu, než je celkový počet citací pro daný vědec. Zejména modelováním rozdělení citací mezi referáty jako rozdělení na náhodné celé číslo a h -index jako Durfeeova čtverce oddílu dospěl Yong ke vzorci , kde N je celkový počet citací, který pro členy matematiky Národní akademie věd ukazuje, že ve většině případů poskytuje přesnou (s chybami obvykle v rozmezí 10–20 procent) aproximaci h -indexu.

Alternativy a úpravy

Byly předloženy různé návrhy na úpravu h -indexu s cílem zdůraznit různé vlastnosti. Jak se varianty množily, staly se možné srovnávací studie, které ukazují, že většina návrhů je vysoce korelována s původním h -indexem, a proto je do značné míry nadbytečná, i když pro rozhodování mezi srovnatelnými životopisy mohou být důležité alternativní indexy, což je často případ procesů hodnocení.

  • Jedinec h -index normalizován počtem autorů bylo navrženo: , s je počet autorů uvažovaných v novinách. Bylo zjištěno, že distribuci h -indexu, i když závisí na poli, lze normalizovat jednoduchým faktorem změny měřítka. Například za předpokladu, že standardně je h s pro biologii, rozdělení h pro matematiku se s ním zhroutí, pokud je toto h vynásobeno třemi, to znamená, že matematik s h  = 3 je ekvivalentní biologovi s h  = 9. Tato metoda nebyl snadno přijat, možná kvůli jeho složitosti. Mohlo by být jednodušší rozdělit počty citací počtem autorů před objednáním prací a získáním h -indexu, jak původně navrhoval Hirsch.
  • M -index je definován jako h / n , kde n je počet let od první publikované práci vědce; také nazývaný m -kvocient.
  • Existuje řada modelů navržených tak, aby zahrnovaly relativní přínos každého autora k příspěvku, například účtováním o pořadí v pořadí autorů.
  • Byla navržena generalizace h -indexu a některých dalších indexů, které poskytují dodatečné informace o tvaru citační funkce autora (těžkopádný, plochý/špičkový atd.).
  • Byly navrženy tři další metriky: h 2 nižší, h 2 střed a h 2 horní, aby poskytly přesnější reprezentaci distribučního tvaru. Tři metriky h 2 měří relativní plochu v distribuci citací vědce v oblasti s nízkým dopadem, h 2 nižší, oblast zachycená h -indexem, h 2 středem a oblast z publikací s nejvyšší viditelností, h 2 horní . Vědci s vysokými horními procenty h 2 jsou perfekcionisté, zatímco vědci s vysokými h 2 nižšími procenty jsou masoví producenti. Protože tyto metriky jsou procenta, jsou určeny k poskytnutí kvalitativního popisu k doplnění kvantitativního h -indexu.
  • Na g -index lze pohlížet jako na h -index průměrného počtu citací.
  • Tvrdilo se, že „Pro jednotlivého výzkumníka opatření, jako je Erdősovo číslo, zachycuje strukturální vlastnosti sítě, zatímco h -index zachycuje citační dopad publikací. Lze snadno přesvědčit, že pořadí v sítích spoluautorství by mělo brát v úvahu obě opatření generují realistické a přijatelné hodnocení. “ Bylo již navrženo několik systémů hodnocení autorů, jako je eigenfactor (založený na centrálnosti vlastních vektorů ), například algoritmus hodnocení fyzického autora.
  • C -index představuje nejen pro citace, ale za kvalitu citací z hlediska vzdálenosti spolupráce mezi citovat a citovaných autorů. Vědec má c -index n , pokud n o [jeho / její] N citace jsou od autorů, které jsou v spolupráce vzdálenosti že alespoň n , a další ( N - n ), citace jsou od autorů, které jsou v spolupráce vzdálenosti nejvýše n .
  • Byl navržen s -index, který představuje neentropické rozložení citací, a ukázalo se, že je ve velmi dobré korelaci s h .
  • E -index, druhá odmocnina z přebytečných citací na h -Set za hodinu 2 , doplňuje h -index pro ignorovány citací, a proto je zvláště vhodný pro vysoce citovaných vědců a pro porovnání shodného h -index (iso - h -indexová skupina).
  • Protože h -index nebyl nikdy určen k měření budoucího publikačního úspěchu, v poslední době skupina výzkumníků zkoumala funkce, které nejvíce předpovídají budoucí h -index. Předpovědi je možné vyzkoušet pomocí online nástroje. Pozdější práce však ukázaly, že vzhledem k tomu, že h -index je kumulativní míra, obsahuje vnitřní automatickou korelaci, která vedla k významnému nadhodnocení její předvídatelnosti. Skutečná předvídatelnost budoucího h -indexu je tedy mnohem nižší ve srovnání s tím, co bylo nárokováno dříve.
  • Index i 10 udává počet akademických publikací, které autor napsal a které citovalo nejméně deset zdrojů. Byl představen v červenci 2011 společností Google jako součást jejich práce na Google Scholar .
  • Ukázalo se, že h -index má silnou zaujatost vůči disciplíně. Jednoduchá normalizace průměrem h učenců v disciplíně d je však účinným způsobem, jak tuto předpojatost zmírnit, a získat tak univerzální metriku dopadu, která umožňuje srovnání učenců napříč různými obory. Tato metoda se samozřejmě nezabývá zaujatostí akademického věku.
  • H -index může být načasovány tak, aby analyzovat jeho vývoj během něčí kariéry, využívající různá časová okna.
  • O -index odpovídá geometrický průměr o h -index a nejvíce citované práce výzkumného pracovníka.
  • Index RA umožňuje zlepšení citlivosti h -indexu na počet vysoce citovaných papírů a pod h -jádrem má mnoho citovaných papírů a necitovaných papírů . Toto vylepšení může zvýšit citlivost měření h -indexu.

Aplikace

Indexy podobné h -index byly použity mimo metriky na úrovni autorů.

H -index byla aplikována na internetových médií, jako je například YouTube kanálů. Je definován jako počet videí s ≥ h × 10 5 zhlédnutí. Ve srovnání s celkovým počtem zhlédnutí tvůrce videa h -index a g -index lépe zachycují produktivitu i dopad v jediné metrice.

Byl také vytvořen postupný index Hirschova typu pro instituce. Vědecká instituce má postupný index Hirschova typu i, když alespoň i výzkumníci z této instituce mají h- index alespoň i .

Viz také

Reference

Další čtení

externí odkazy