저자: He Zhao, Chang Ma, Fangzhi Xu, Lingpeng Kong, Zhi-Luo Deng | 날짜: 2025 | DOI: 10.48550/arXiv.2502.16660
Figure 1: BioMaze 작업 및 추론 방법의 설명. 생물학적 경로 그래프 데이터 지원 유무에 따른 추론 방식 비교
본 논문은 생물학적 경로(biological pathway) 추론 능력을 평가하기 위한 BioMaze 벤치마크를 제시하고, LLMs의 경로 추론 한계를 보완하기 위해 PathSeeker라는 에이전트 기반 방법을 제안한다. 이를 통해 복잡한 생물학적 시스템에서의 다단계 인과 추론 문제를 해결한다.
Figure 4: 다양한 LLM의 생물학적 경로 추론 능력 비교. 모든 LLM이 경로 추론에서 어려움을 겪으며, 특히 섭동 시나리오에서 성능 저하가 심함
Figure 5: 추론 단계 증가에 따른 Chain-of-Thought 성능 감소
Figure 2: BioMaze 데이터셋의 생물학적 영역 및 추론 유형 분포. 6개 주요 영역과 3가지 분류 차원 포함
Figure 3: PathSeeker의 경로 그래프 데이터베이스 대화형 탐색 메커니즘. 글로벌-로컬 부분그래프를 수요에 맞게 탐색
BioMaze 벤치마크 구축:
분류 체계 (3가지 차원):
PathSeeker 방법론:
총평: 본 논문은 생물학적 경로 추론이라는 미개척 분야에서 대규모 고품질 벤치마크를 제공하고 LLMs의 실질적 한계를 규명했다는 점에서 매우 가치있다. 특히 실제 연구 문헌 기반의 5.1K 문제와 체계적 분류 체계는 학계에 중요한 자산이 될 것이다. 다만 제안된 PathSeeker 방법의 구체적 구현과 성능 개선 효과에 대한 더욱 상세한 실험 결과 제시가 논문의 완성도를 높일 것으로 판단된다.