S2ORC: The Semantic Scholar Open Research Corpus

저자: Kyle Lo, Lucy Lu Wang, Mark Neumann, Rodney Kinney, Daniel Weld | 날짜: 2020 | DOI: 10.18653/v1/2020.acl-main.447


Essence

Figure 1

Figure 1: Inline citations and references to figures and

81.1M개의 학술논문으로 구성된 S2ORC 코퍼스를 소개하며, 8.1M개의 오픈액세스 논문에 대해 구조화된 전문(full text)과 인용 관계를 기계가독형으로 제공한다.

Motivation

Achievement

Figure 1

Figure 1: Inline citations and references to figures and

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: S2ORC는 학술 논문 분석을 위한 가장 포괄적이고 구조화된 대규모 공개 코퍼스로서, 학술 텍스트 마이닝, 인용 분석, 지식 추출 등 다양한 NLP 연구를 촉진할 수 있는 중요한 기여이다.

같이 보면 좋은 논문

기반 연구
SciSci 연구에 필수적인 대규모 학술 데이터 인프라를 제공한다.
다른 접근
Microsoft Academic Graph와 유사하게 대규모 학술 메타데이터를 제공하는 대안적 플랫폼이다.
다른 접근
Microsoft Academic Graph 대안으로 완전 개방형 학술 메타데이터 플랫폼을 제공한다.
다른 접근
특정 도메인(촉매)에 특화된 대규모 데이터셋으로 일반적 학술 코퍼스와 보완적 관계이다.
응용 사례
대규모 학술 코퍼스를 활용하여 과학-정책 변환이라는 실용적 문제를 해결한다.
← 목록으로 돌아가기