방법론 : HCR 선발 방법

클래리베이트 애널리틱스 2017 Highly Cited Researchers

방법론

가장 최근 발표한 2017년 HCR의 선정에는 클래리베이트 애널리틱스가 제공하는 Essential Science Indicators (ESI)의 2005-2015까지의 데이터를 활용하였습니다. 여기에는 134,832개의 상위 피인용 페이퍼(HCP, Highly Cited Papers)가 포함되어 있으며 각각의 페이퍼 중 ESI 필드 등록 및 출판년도별로 상위 1% 이상의 인용수를 가진 페이퍼를 가장 많이 보유한 연구자가 HCR이 됩니다. ESI에서 어떻게 상위 피인용 페이퍼로 선정되는지 더 자세한 내용은 Essential Science Indicators Help를 통해 확인할 수 있습니다.

2017년 다음 21개의 연구 영역에서 HCR이 발표되었습니다.

Agricultural Sciences
Biology & Biochemistry
Chemistry
Clinical Medicine
Computer Science
Engineering
Materials Science
Mathematics
Pharmacology & Toxicology
Physics
Economics & Business
Environment/Ecology
Geosciences
Immunology
Microbiology
Molecular Biology & Genetics
Neuroscience & Behavior
Plant & Animal Science
Psychiatry/Psychology
Social Sciences, general
Space Science

Essential Science Indicators

ESI는 Web of Science 를 기반으로 SCIE(Science Citation Index Expanded)와 SCCI(Social Sciences Citation Index)를 조사하여 과학 및 사회과학분야의 저널 아티클을 제공합니다. 전세계 12,000여 종 저널에 게재된 1200여 만 개 우수 논문 데이터에 기반하고 있으며 여기에는 아티클 혹은 리뷰로 구분된 데이터만 엄선하므로 에디터에게 작성된 편지나 수정/정정 공지 혹은 기타 중요성이 없다고 판단되는 내용들은 모두 걸러지게 됩니다.

 

ESI 데이터 분류

전년도 데이터가 완결되는 시점의 Raw data를 추출하여 22개 ESI 카테고리 중 Multidisciplinary에 해당되는 논문들을 나머지 21개 카테고리에 포함되도록 재분류

Essential Science Indicators에서 HCP(최상위 논문; Highly Cited Papers)를 포함한 모든 논문들은 22개의 분야 중 하나로 분류되게 됩니다. 22개의 분야에는 위에 언급한 21개 외 Multidisciplinary가 포함됩니다. ESI의 각 저널을 단일 카테고리로 분류하며, Science, Nature, Proceedings of the National Academy of Sciences of the USA 및 기타 복수 저널의 경우에는 특별한 추가 분석을 통해 분류됩니다. 이와 같은 간행물의 각각의 아티클은 개별적으로 저널이 인용된 레퍼런스에 대한 평가 등 심도 깊은 리뷰 및 평가과정을 거치게 됩니다. 그 후 가장 빈번하게 레퍼런스로 인용된 카테고리로 최종적으로 분류됩니다. 이러한 재분류 과정에 대해서 더 자세한 사항은 Classification of Papers in Multidisciplinary Journal 페이지에서 확인할 수 있습니다.

 

HCR 기준 확정

각 분야별 t(Threshold)값 이상의 HCP를 보유한 연구자 (HCR-a)
각 분야별 t-1개의 HCP를 보유한 연구자 중 HCR-a 그룹 기준 평균 50% 이상 피인용을 기록한 연구자 (HCR-b)

 

연구자(저자) 정보 확인 (Author Disambiguation)

ESI 기준 HCR(Higlhy Cited Researcher) 리스트를 HCP(Highly Cited Paper)를 가장 많이 보유한 순서대로 정렬
21개 분야별 “상위 1% 저자(HCR)” 수의 제곱근에 해당하는 순위의 연구자가 보유한 HCP의 숫자가 HCR의 기준값(Threshold)로 적용(t)
HCR-a 및 HCR-b 리스트를 대상으로 보다 정밀한 연구자 정보 확인 작업
최정 선정된 HCR의 소속 기관 확인 및 정정을 통해 최종 HCR List 확정

각각의 ESI 카테고리 내 저자 이름의 순위는 지난 2005년부터 2015년까지 HCPs(Highly Cited Papers) 숫자에 기반하여 작성되었으며 2017년 HCR 선정의 기준이 되었습니다. 당사는 중복된 이름이나 성/이름이 바뀐 경우를 자체적인 알고리즘 분석을 통해 구분해내 최종 결과를 발표하고 있습니다. 만약 모호하거나 정확하지 않은 정보가 있을 경우 따로 매뉴얼에 따라 담당자가 직접 리뷰하여 업데이트하여 오류를 최소화하고자 노력하고 있습니다. 이 과정에서 비슷한 저자의 성이나 한 개 이상의 중복된 이니셜로 논문이 검색되는 경우 연대순 혹은 다른 기타 정보(출판 저널, 연구 토픽 혹은 주제, 소속 기관의 주소, 공동 연구 현황 및 기타 연구자 정보에 도움이 될 키워드)를 통해 재탐색하여 정보를 최대한 정확하게 업데이트합니다. 연구자들은 연구기간 동안, 몇 번이고 그들의 소속 기관 및 정보를 수정 요청할 수 있으므로 연구자와 그들의 소속 기관은 HCR 연구자의 정보를 늘 최신으로 업데이트 요청하는 것이 필요합니다.

 

ESI 내 저자 정보가 해당된 카테고리로 분류되고 정확한 정보가 업데이트된 후, HCP 수에 따라 저자들의 순위가 매겨지게 됩니다. 새로운 HCR 리스트에 얼마나 많은 연구자들을 포함시킬지 결정하기 위해 각각의 ESI 필드를 확인하여 그 필드 내 포함되어 있는 HCP 저자들의 숫자를 파악하는데 각각의 필드로 분류된 저널 규모가 실제로 그 필드에 포함된 저자수와 굉장히 다른 경우가 많이 발생합니다. 예를 들면, ESI의 Economics & Business, Immunology, Microbiology, Space Science (Astronomy & Astrophysics) 필드에서 저자수로 보면 약 18.6%에 달하지만 HCP의 분류를 통해서 보면 각각 1.8%, 1.8%, 1.4%, 1.0% 에 불과합니다.

각각의 ESI 필드에서 저자명(연구자 정보 확인을 거치기 전 불확실한 정보인 상태)으로 계산한 숫자가 먼저 확인되면 그 숫자의 제곱근을 계산하고 그 숫자를 각각의 ESI 필드에 얼마나 많은 연구자들이 포함되었는지 확인하는 잣대로 사용합니다. 이렇게 HCP수를 기준으로 순위를 매긴 연구자 정보에서 앞서 얘기한 제곱근 점수를 바탕으로 확인한 논문수로 기준값(threshold)을 반영하여 정확성을 높입니다. 만약 어떤 저자가 이 기준값(threshold)을 기준으로 볼때 한계값보다 1편 적은 HCP를 가지고 있는 경우, 또 하나의 필터링 장치로서 그 연구자의 HCP 피인용수가 HCP 혹은 한계값보다 높아 상위 50% 이상이라고 판단되는 경우 이 역시 HCR로 포함시키게 됩니다. 이 외에도, 개별 연구자의 HCP의 피인용수는 2005년부터 2015년까지 Top 1%(Highly Cited list)에 사용된 각 ESI 필드의 총 피인용수의 기준값과 동일하거나 그 이상이어야 합니다.

화학, 엔지니어링 혹은 소재과학과 같은 일부 필드에서는 많은 중국인 저자들이 HCP로 등재되어 있습니다. 여기에서 많은 경우 성과 이름이 혼재되면서 중복 저자로 인식되는 경우도 있습니다. 리뷰를 거쳐 상당수 업데이트 되게 되며 성/이름 중 일부만 있다거나 저자정보가 부정확할 때에는 일부 삭제되는 경우도 있습니다. 이런 경우는 일부 필드에서는 생각보다 빈번하게 발생되고 있으며 이런 연유로 필드별 기준값이 변경되는 일도 생기고는 합니다. 하지만 최종적인 리뷰를 통해 정확한 기준값은 산출되며 이를 통해 HCR 정보를 확인합니다.

 

예외

우주과학과 물리학의 경우, 공동 연구 기관이 30곳 이상인 HCP는 제외

위의 방법론은 물리학 및 우주과학을 제외하고는 모든 ESI 필드에서 적용됩니다. 물리학의 하이 에너지 실험 혹은 대규모 팀으로 꾸려진 우주 과학(Space Science) 분야의 우주 미션 등의 경우 보통 수백명의 저자명을 갖게 되는데 이 경우에는 하이 에너지 실험 혹은 우주 과학 미션에만 연구한 저자들은 다른 서브필드에서 삭제합니다. 이 부분은 물리학 혹은 우주 과학 카테고리 내 30곳 이상의 공동 연구 기관에서 발표된 논문들 중에서 판단하여 삭제하는 것으로 결정되었으며 하이 에너지 물리학 및 대규모 우주 미션 2개 분야에 지나친 연구자 수가 포함되는 것을 막아 형평성을 높이는데 꼭 필요한 과정으로 활용되고 있습니다.

HCR 산출 방법론에 대해 더 궁금한 내용은 글로벌 HCR 페이지에서도 확인 가능합니다.