저자: Mark Neumann, Daniel King, Iz Beltagy, Waleed Ammar (Allen Institute for Artificial Intelligence) | 날짜: 2019 | 출처: BioNLP 2019 Workshop
생의학 분야의 급증하는 학술 논문 처리를 위해 spaCy 라이브러리를 기반으로 생의학 텍스트에 특화된 NLP 파이프라인을 개발하여 실무 환경에서의 빠른 처리 속도와 견고한 성능을 동시에 달성하였다.
표 2: 다양한 생의학 NLP 파이프라인의 처리 속도 비교
총평: ScispaCy는 학술적 혁신성보다는 실무적 타당성에 중점을 두고 생의학 NLP의 중요한 공백을 채우는 실용적인 기여. 높은 처리 속도와 공개 가능한 완전한 파이프라인은 생의학 텍스트 마이닝 연구와 응용의 진입장벽을 획기적으로 낮추었다.