저자: Zhizheng Wang, Qiao Jin, Chih-Hsuan Wei, Shubo Tian | 날짜: 2025 | DOI: 10.1038/s41592-025-02748-6
GeneAgent의 4단계 파이프라인: 생성(Generation), 자기검증(Self-verification), 수정(Modification), 요약(Summarization). 자기검증 단계에서 도메인 특화 데이터베이스와 상호작용하여 환각을 감지하고 검증 보고서를 생성함.
대규모 언어모델(LLM)의 환각(hallucination) 문제를 자기검증 메커니즘으로 해결하는 유전자 집합 분석 AI 에이전트를 제시하며, GPT-4 대비 현저히 높은 정확도를 달성한다.
세 데이터셋(GO, NeST, MSigDB)에 걸친 ROUGE 점수 및 의미 유사도(semantic similarity) 비교. GeneAgent이 모든 메트릭에서 GPT-4를 일관되게 상회함.
selfVeri-Agent의 동작 예시: RTK signaling 관련 클레임이 데이터베이스 쿼리를 통해 MAPK signaling pathway와만 관련 있음을 확인하고 "부분 지지됨(partially supported)" 판정.
총평: GeneAgent는 도메인 데이터베이스 활용 자기검증으로 LLM의 환각 문제를 창의적으로 해결하며, 대규모 벤치마크와 실무 검증을 통해 생물정보학 분야의 신뢰도 있는 AI 활용을 선도하는 의미 있는 연구이다. 다만 미지의 유전자 기능 발견 능력과 다양한 생물종 적용성 확대가 향후 과제이다.