저자: Haoyang Liu, Yijiang Li, Jinglin Jian, Yuxuan Cheng, Jianrong Lu | 날짜: 2024 | DOI: 10.48550/arXiv.2402.12391
TAIS의 개요: 프로젝트 매니저, 데이터 엔지니어, 통계학자, 도메인 전문가, 코드 리뷰어의 5개 역할이 협업하여 유전자 발현 데이터에서 질병 예측 유전자를 식별
대규모 언어모델(LLM)을 기반으로 한 AI 과학자 팀(TAIS)이 데이터 선택, 전처리, 혼재 인자 보정, 조건 예측을 자동화하여 질병 관련 유전자 발견 파이프라인을 효율화하는 시스템을 제안한다.
데이터 엔지니어와 코드 리뷰어 간의 쓰기-실행-감시 루프: 코드 생성 후 표준출력/표준에러를 검증하고 피드백 반복
데이터 엔지니어와 도메인 전문가 간의 협의: 생물의학 결정(임상 라벨 추출, 유전자 식별자 통합 등)에 대한 지식 기반 지도
총평: 본 논문은 LLM 기반 멀티에이전트 시스템을 유전자 발현 데이터 분석에 창의적으로 적용하고, 혼재 인자 보정과 현실 연구팀 모의를 통해 자동화된 과학적 발견의 새로운 가능성을 보여주는 의미 있는 연구이다. 다만 임상 검증, 확장성, 대규모 벤치마크를 통한 강화가 후속 단계에서 필수적이다.