저자: F. A. Wolf, Philipp Angerer, Fabian J Theis | 날짜: 2018 | DOI: 10.1186/s13059-017-1382-0
SCANPY는 백만 개 이상의 세포를 포함한 대규모 단일세포 유전자 발현 데이터를 효율적으로 분석할 수 있는 Python 기반 확장 가능한 툴킷으로, 기존 R 기반 프레임워크들(Seurat, Monocle 등)보다 5-90배 빠른 성능을 제공한다.
Figure 1a: 68,579개의 말초혈액 단핵세포(PBMC)를 이용한 SCANPY의 분석 파이프라인: 전처리, 정규화, 고변이성 유전자 식별, t-SNE 및 그래프 드로잉 시각화, Louvain 알고리즘을 통한 클러스터링, 차등 발현 유전자 검증, 의사시간 순서화를 통한 분기 궤적 재구성
총평: SCANPY는 빠르게 성장하는 단일세포 유전체 분석 분야에서 Python 생태계에 처음으로 대규모 데이터 처리가 가능한 포괄적 도구킷을 제공함으로써, 학계와 산업계에 즉각적이고 지속적인 영향을 미쳤으며, 특히 AnnData 클래스는 후속 도구들의 표준으로 채택될 정도로 기여도가 매우 높다.