저자: Susie Xi Rao, Peter H. Egger, Ce Zhang | 날짜: 2024-07-25 | DOI: 10.48550/arXiv.2302.00390
Fig. 3 Three-level hierarchical classification system.
Microsoft Academic Graph의 1.6억 개 논문 초록을 이용하여 44개 학문분야, 718개 필드, 1,485개 세부분야로 계층적으로 자동 분류하는 딥러닝 시스템을 제시하며, 단일/다중 레이블 설정에서 90% 이상의 정확도를 달성한다.
Fig. 4 Distributions of total papers, number of fields and their ratio in 44 disciplines.
Fig. 2 Discipline (JEL) publication mapping using FOS tags from MAG.
총평: 본 논문은 전 학문분야를 포괄하는 첫 통일 계층 분류 시스템으로, 학제간 연구 측정과 학문 활동의 자동 색인화에 실질적 기여를 한다. 1.6억 규모 데이터와 3,140회 실험을 통한 강건한 검증과 공개 코드베이스로 높은 재현성과 실용성을 제공한다.