저자: Elliot Xie, Lingxin Cheng, Jack M. Shireman, Yujia Cai, Jihua Liu | 날짜: 2025 | DOI: 10.1101/2024.12.04.626476
CASSIA의 다중 에이전트 LLM 시스템 구조. 온보딩 플랫폼을 통해 사용자 입력을 받고, Annotator, Validator, Formatter, Scorer, Reporter 에이전트가 순차적으로 작동하며, 선택적 에이전트들(Subclustering, Uncertainty Quantification, RAG)도 활용 가능
CASSIA는 단일세포 RNA-seq 데이터의 자동화된 세포주석(cell annotation)을 위한 다중 에이전트 대규모 언어모델(LLM) 시스템으로, 기존 방법보다 12-41% 높은 정확도를 달성하면서 해석 가능한 품질 점수와 불확실성 정량화를 제공한다.
5개 벤치마크 데이터셋에서 완전히 정확한 주석(fully correct)은 12-41% 개선, 부분적으로 정확한 주석까지 포함한 결과는 9-29% 개선
면역세포 분류에서 25% 이상의 성능 향상(좌측), 종양 미세환경에서 암 세포 구분(중앙), 비모델 생물종(상어, 집고양이, 호랑이, 천산갑)에서 14-77% 정확도 개선(우측)
총평: CASSIA는 다중 에이전트 LLM 시스템을 통해 세포주석의 정확도, 해석 가능성, 품질 평가를 동시에 달성한 혁신적 방법으로, 특히 복잡한 세포 집단과 비모델 생물종 분석에서 실질적 가치를 입증했으나, peer review 전 상태이고 계산 효율성 및 기술적 세부 사항에 대한 추가 검증이 필요하다.