H-index

h-index är ett mått för citeringsanalys, som beskriver både produktivitet och räckvidd i publicering för en forskare eller akademiker.

Givet att en persons publikationer är sorterade fallande efter antalet citeringar så är h-index ordningsnumret för den sista artikel där antalet citeringar är större än eller lika med ordningsnumret.

Kortfattat innebär ett h-index på 10 att en person är medförfattare till minst 10 artiklar där varje artikel blivit citerad minst 10 gånger, totalt minst 100 citeringar, vilket kan vara fallet för en docent eller nybliven professor. Ett h-index på 100 kräver minst 10 000 citeringar och en omfattande vetenskaplig publicering.

d-index (Discipline H-index) är ett liknande mått där citeringsanalysen avgränsas till en viss disciplin (forskningsområde) och vissa korrigeringar görs med avseende på graden av medverkan (författare, medförfattare) i de granskade artiklarna.[1][2]

Bakgrund

Indexet föreslogs 2005 av Jorge E. Hirsch(en), en fysiker vid UCSD, University of California, San Diego, som ett verktyg för att jämföra omfattning och kvalitet i publicering för teoretiska fysiker[3] och kallas ibland för "The Hirsch index" eller Hirsch number.

Indexet har fått en viss spridning, och redovisas till exempel automatiskt för den som skapar en profil i Google Scholar, samt för andra vetenskapliga bibliotekstjänster, till exempel Scopus, Elsevier’s databas för artiklar och citeringar. Vid beräkningen inkluderar Google Scholar även andra publikationer (till exempel böcker), vilket gör att redovisat h-index normalt blir högre än till exempel Scopus som har en mer strikt avgränsning till vetenskapliga artiklar.[4]

Definition

En forskare tar fram kunskap och producerar artiklar, som huvud- eller medförfattare, som sänds till vetenskapliga tidskrifter. Efter granskning kan en artikel accepteras och publiceras. Andra forskare läser artikeln, och kan välja att citera denna artikel i andra artiklar. Ett enkelt mått på den enskilda artikelns "kvalitet" eller "avtryck" är antalet citeringar, .

Enkla mått på forskarens produktivitet eller "avtryck" är det totala antalet artiklar , samt det totala antalet citeringar , alltså summan av antalet citeringar för samtliga artiklar.

För att beräkna h-index sorteras artiklarna i fallande ordning efter antalet citeringar, så att är artikeln med störst antal citeringar , den med näst störst antal citeringar , och den med minst antal citeringar .

h-index är då ordningsnumret för den sista artikel där antalet citeringar är större än eller lika med ordningsnumret, det vill säga .

Annorlunda uttryckt så innebär till exempel ett h-index på 10 att en person är medförfattare till minst 10 publicerade artiklar, där samtliga vardera har minst 10 citeringar.

Exempel

Grafisk presentation av h-index
Grafisk presentation av h-index

En forskare har publicerat 12 artiklar. I tabellen visas antalet citeringar i fallande ordning:

Exempel 1
Artikel nr 1 2 3 4 5 6 7 8 9 10 11 12 Tot
Citeringar 20 14 11 9 7 6 5 3 2 1 0 0 78

Den 6:e artikeln har 6 citeringar varför h-index blir 6.

En annan forskare har också publicerat 12 artiklar, och fått stor publicitet för en av sina artiklar som fått 50 citeringar, och i övrigt enligt tabellen nedan:

Exempel 2
Artikel nr 1 2 3 4 5 6 7 8 9 10 11 12 Tot
Citeringar 50 8 6 5 3 2 2 1 1 0 0 0 78

Den 4:e artikeln har 5 citeringar, men den 5:e har 3, varför h-index blir 4.

De båda forskarna har samma antal publicerade artiklar, och samma totala antal citeringar, men den förste får ett högre h-index på grund av en jämnare fördelning över sina artiklar av antalet citeringar.

Exemplet visar att ett högt h-index inte kan uppnås med en enstaka "succé-artikel", utan kräver att många artiklar producerats där många av dessa citerats av många personer.

Avgränsningar

Om inget annat angives är h-indexet förmodligen beräknat på personens samtliga artiklar, men det förekommer avgränsningar i urvalet av artiklar som att:

  • självciteringar undantas (där forskaren refererar till sina egna artiklar)
  • urvalet av artiklar begränsas till en viss tidsperiod (till exempel "de sista 5 åren")
  • urvalet begränsas till en viss disciplin eller till vissa tidskrifter

En sådan avgränsning minskar antalet artiklar och därmed också det beräknade h-indexet, men kan då göra måttet mer relevant och underlätta jämförelser med andra personer om samma avgränsning gjorts för dem.

D-index eller Discipline H-index är ett exempel på en sådan avgränsning, där citeringsanalysen avgränsas till en viss disciplin (forskningsområde). Dessutom görs vissa korrigeringar med avseende på graden av medverkan (författare, medförfattare) i de granskade artiklarna.[1][2]

Diskussion

Varje försök att skapa mått på vetenskaplig publicering har svagheter och måste tolkas med försiktighet. En svaghet är att olika discipliner har olika mönster eller rutiner för hur publicering sker.

  • Det kan finnas avsevärda skillnader mellan vilken mängd arbete som ligger bakom en enskild artikel, vilket kan ge stora skillnader i antalet möjliga publicerade artiklar.
  • Det kan finnas avsevärda skillnader mellan vad som krävs för att få stå med som medförfattare i en artikel - vissa artiklar kan ha ett stort antal medförfattare där några kanske bara gjort mindre bidrag som till exempel att granska artikeln. Detta påverkar självfallet antalet möjliga publicerade artiklar för de enskilda medförfattarna.[5]
  • h-index beaktar inte hur personen är placerad i medförfattarlistan vilket kan vara en indikation på graden av medverkan i artikeln. Även här finns olika traditioner - normalt är förstanamnet huvudförfattaren, medan tillkommande författare kan vara uppräknade i alfabetisk ordning eller ordnade efter grad av medverkan, och sistaplatsen kan vara tillägnad huvudhandledare.[5]
  • Olika vetenskapliga tidskrifter har olika rykte eller "impact factor" och det kan vara lättare att få sina artiklar accepterade i en mindre prestigefylld tidskrift.
  • Olika kunskapsområden har olika traditioner för omfång och citeringsmönster, vilket tenderar att ge forskare inom sociologi och humaniora lägre h-index än inom till exempel medicin, teknik och ekonomi.[6]

Dessa svagheter har dock h-index gemensamt med till exempel måtten "antal artiklar" och "antal citeringar".

Sammantaget innebär detta att alla mått inklusive h-index, "antalet publiceringar" eller "antalet citeringar" blir trubbiga speciellt om man försöker jämföra över disciplin- och landgränser.

h-index kan i viss mån bemöta dessa svagheter genom att det både återger att författaren har många publiceringar, och att många av dessa måste ha många citeringar. Att till exempel publicera i mindre kända tidskrifter må vara en "genväg" att få ett stort antal publiceringar, men om dessa tidskrifter har få läsare så kommer responsen i form av citeringar att bli begränsad, och begränsa möjligt h-index.

Verkligt höga h-index kräver ett betydligt större antal citeringar än låga. Implicit innebär ett h-index på till exempel 10 att personen har minst 10 artiklar med 10 citeringar eller fler, det vill säga minst 100 citeringar, medan ett h-index på 20 på samma sätt innebär minst 400 citeringar, 30 innebär minst 900 och så vidare.

Ett högt h-index blir därför ett mått på att det inte bara har publicerats artiklar, utan att de verkligen befunnits läsvärda av ett stort antal personer. Det krävs också att många artiklar är citerade - en enstaka "succé-artikel" med ett stort antal citeringar kan inte ensam ge ett högt h-index.

Exempel

En av de genom tiderna mest produktiva matematikerna är Paul Erdős (1913–1996) som producerade omkring 1 500 matematiska uppsatser. Enligt Google Scholar[7] har han (2024) över 110 000 citeringar och ett h-index på 134. Det kan vara värt att notera att Erdős h-index ett kvartssekel efter hans bortgång alltjämt fortsätter att öka, då det fortlöpande skrivs nya artiklar där han citeras.

En välkänd svensk fysiker med en mycket omfattande publicering är Max Tegmark. Enligt Google Scholar[8] har han (2024) över 86 000 citeringar och ett h-index på 127, medan han (2024) i Scopus har drygt 52 000 citeringar och 98 i h-index.[9]

En svensk professor inom humaniora med en betydande men ändå mer "normal" publicering är religionshistorikern Göran Larsson. Enligt Google Scholar[10] har han (2024) drygt 1 800 citeringar och ett h-index på 25, medan han (2024) i Scopus[11] har drygt 400 citeringar och ett h-index på 12.

Enligt en amerikansk undersökning 2019 bland akademiskt verksamma läkare anges ett h-index på 6–10 vara representativt för docenter (associate professors) och 12–24 för professorer.[12][13] En sammanställning från 2024 anger bland annat h-index i spannet 20–40 som typiskt för professorer inom humaniora, medan motsvarande inom datorvetenskap anges till 33–60.[6]

Referenser

  1. ^ [a b] Di Caro, Luigi; Cataldi, Mario; Schifanella, Claudio (2012-12). ”The d-index: Discovering dependences among scientific collaborators from their bibliographic data records” (på engelska). Scientometrics 93 (3): sid. 583–607. doi:10.1007/s11192-012-0762-1. ISSN 0138-9130. http://link.springer.com/10.1007/s11192-012-0762-1. Läst 3 februari 2024. 
  2. ^ [a b] ”Best Scientists Ranking Methodology - What is D-index”. Research.com. 2024. https://research.com/our-methodology. Läst 3 februari 2024. 
  3. ^ Hirsch, J. E. (15 November 2005). ”An index to quantify an individual's scientific research output”. PNAS 102 (46): sid. 16569–72. doi:10.1073/pnas.0507655102. PMID 16275915. Bibcode2005PNAS..10216569H. 
  4. ^ ”H-Index Using Web of Science, SCOPUS, and Google Scholar”. The University of Texas at Dallas. https://libguides.utdallas.edu/h-index-using-web-of-science-scopus-google-scholar/introduction/google-scholar. Läst 17 november 2024. 
  5. ^ [a b] Tscharntke, Teja; Hochberg, Michael E.; Rand, Tatyana A.; Resh, Vincent H.; Krauss, Jochen (2007-1). ”Author sequence and credit for contributions in multiauthored publications”. PLoS biology 5 (1): sid. e18. doi:10.1371/journal.pbio.0050018. ISSN 1545-7885. PMID 17227141. PMC: PMC1769438. https://www.ncbi.nlm.nih.gov/pubmed/17227141. Läst 21 december 2018. 
  6. ^ [a b] Andry Stapleton (20 augusti 2024). ”What is a good H-index for each academic position?”. Academia Insider. https://academiainsider.com/what-is-a-good-h-index-for-each-academic-position/. Läst 26 november 2024. 
  7. ^ ”Google Scholar - Profil - Paul Erdős”. https://scholar.google.se/citations?user=cVeVZ1YAAAAJ&hl=sv&oi=ao. Läst 26 november 2024. 
  8. ^ ”Google Scholar - Profil - Max Tegmark”. https://scholar.google.com/citations?user=eBXEZxgAAAAJ&hl=en. Läst 1 mars 2024. 
  9. ^ ”Profil - Tegmark, Max”. Elsevier / Scopus. https://www.scopus.com/authid/detail.uri?authorId=7005575954. Läst 17 november 2024. 
  10. ^ ”Profil - Göran Larsson”. Google Scholar. https://scholar.google.se/citations?user=Q2qaWSIAAAAJ&hl=sv&oi=ao. Läst 26 november 2024. 
  11. ^ ”Profil Larsson, Göran”. Scopus, Elsevier. https://www.scopus.com/authid/detail.uri?authorId=21635248500. Läst 26 november 2024. 
  12. ^ Schreiber, William E; Giustini, Dean M (2019-02-04). ”Measuring Scientific Impact With the h-Index” (på engelska). American Journal of Clinical Pathology 151 (3): sid. 286–291. doi:10.1093/ajcp/aqy137. ISSN 0002-9173. https://academic.oup.com/ajcp/article/151/3/286/5139644. Läst 31 oktober 2020. 
  13. ^ ”Scientific Impact and the H-Index”. AACC - American Association for Clinical Chemistry. september 2019. https://www.aacc.org/cln/articles/2019/september/scientific-impact-and-the-h-index. Läst 31 oktober 2020. 

Externa länkar