저자: Zhiqian Lan, Yuxuan Jiang, Ruiqi Wang et al. | 날짜: 2025 | DOI: arXiv:2505.14030v3
본 논문은 생물 실험실 환경에서 로봇의 자동화를 평가하기 위한 시뮬레이션 프레임워크 및 벤치마크 AutoBio를 제시한다. 비전-언어-액션(VLA) 모델의 정밀 조작, 명령 수행, 시각 추론 능력을 과학 워크플로우에서 평가하는 최초의 전문 과학 영역 벤치마크이다.
총평: AutoBio는 로봇 자동화 벤치마크를 전문 과학 영역으로 확장하는 의미 있는 작업으로, 정밀 조작과 다중모드 상호작용이 필요한 생물 실험실을 체계적으로 모사한 첫 번째 프레임워크이다. 3DGS 기반 자산 디지털화, 생물 실험 특화 물리 플러그인, PBR 렌더링 등 기술적 기여가 견고하며, VLA 모델 평가에서 명확한 성능 격차를 드러냈다. 다만 실제 로봇 검증과 더 광범위한 모델 평가가 진행되면 영향력이 더욱 커질 것으로 예상된다.