저자: Ruofan Jin, Zaixi Zhang, Mengdi Wang, Le Cong | 날짜: 2025 | DOI: 10.1101/2025.07.01.662467
STELLA의 전체 프레임워크: 매니저 에이전트, 개발 에이전트, 비평 에이전트, 도구 생성 에이전트가 협력하며, 템플릿 라이브러리와 도구 오션이 자동으로 진화한다.
STELLA는 바이오의학 연구 질문에 자동으로 적응하고 경험으로부터 학습하는 자기진화형(self-evolving) AI 에이전트로, 동적 템플릿 라이브러리와 확장 가능한 도구 풀을 통해 기존의 정적 도구 집합이라는 한계를 극복한다.
벤치마크 성과: (A) Humanity's Last Exam: Biomedicine, LAB-Bench: DBQA, LAB-Bench: LitQA에서 SOTA 달성. (B) 계산 예산 증가에 따른 정확도 향상 (자기진화 효과).
총평: STELLA는 바이오의학 AI 에이전트의 자기진화 메커니즘이라는 혁신적 개념을 제시하고 이를 실증적으로 증명한 의미 있는 연구이나, 절대 성능의 낮음과 기술 상세의 부족으로 인해 실제 바이오의학 연구 현장에서의 즉각적 적용 가능성은 제한적이며, 추가적인 검증과 개선이 필요하다.