Hierarchical Classification of Research Fields in the "Web of Science" Using Deep Learning

저자: Susie Xi Rao, Peter H. Egger, Ce Zhang | 날짜: 2024-07-25 | DOI: 10.48550/arXiv.2302.00390


Essence

Figure 3

Fig. 3 Three-level hierarchical classification system.

Microsoft Academic Graph의 1.6억 개 논문 초록을 이용하여 44개 학문분야, 718개 필드, 1,485개 세부분야로 계층적으로 자동 분류하는 딥러닝 시스템을 제시하며, 단일/다중 레이블 설정에서 90% 이상의 정확도를 달성한다.

Motivation

Achievement

Figure 4

Fig. 4 Distributions of total papers, number of fields and their ratio in 44 disciplines.

How

Figure 2

Fig. 2 Discipline (JEL) publication mapping using FOS tags from MAG.

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: 본 논문은 전 학문분야를 포괄하는 첫 통일 계층 분류 시스템으로, 학제간 연구 측정과 학문 활동의 자동 색인화에 실질적 기여를 한다. 1.6억 규모 데이터와 3,140회 실험을 통한 강건한 검증과 공개 코드베이스로 높은 재현성과 실용성을 제공한다.

같이 보면 좋은 논문

기반 연구
토픽 기반 좌표 체계가 계층적 분류 시스템의 이론적 토대가 될 수 있다.
다른 접근
수동적 분류 체계 구축 대신 딥러닝 기반 자동 계층 분류를 제안한다.
다른 접근
계층적 자동 분류와 토픽 기반 좌표 체계라는 서로 다른 지식 구조화 방법을 제시한다.
다른 접근
수동적 지식 조직 체계 대신 딥러닝 기반 자동 분류 시스템을 제안한다.
반론/비판
기존 지식 조직 체계의 한계를 딥러닝 기반 자동 분류로 극복하려는 대안적 접근이다.
← 목록으로 돌아가기