Can ai agents design and implement drug discovery pipelines? arXiv preprint arXiv:2504.19912, 2025.

저자: Khachik Smbatyan, Tsolak Ghukasyan, Tigran Aghajanyan, Hovhannes Dabaghyan, Sergey Adamyan, Aram Bughdaryan, Vahagn Altunyan, Gagik Navasardyan, Aram Davtyan, Anush Hakobyan, A. Gharibyan, Arman Fahradyan, A. Hakobyan, Hasmik Mnatsakanyan, Narek Ginoyan, Garik Petrosyan | 날짜: 2025 | DOI: N/A


Essence

본 논문은 대규모 언어모델(LLM) 기반 자율 AI 에이전트가 신약 발견(drug discovery) 파이프라인을 독립적으로 설계하고 구현할 수 있는지 평가하기 위한 DO Challenge 벤치마크를 제시하고, 이에 기반한 멀티-에이전트 시스템 Deep Thought의 성능을 분석한 연구이다.

Motivation

Achievement

  1. DO Challenge 벤치마크 제시: 100만 개의 분자 구조로부터 DO Score가 가장 높은 상위 1,000개 분자 식별이라는 단일 통합 문제로서, 자원 제약(상위 10% 라벨링 가능, 3회 제출 제한) 하에서 AI 에이전트의 전략적 계획, 코드 작성/실행, 적응성 평가
  2. Deep Thought 멀티-에이전트 시스템 개발 및 성능 검증:
    • 시간 제약 조건(10시간): 상위 1,000개 분자와의 겹침률(overlap) 33.5% 달성 → 최고 인간 전문가(33.6%)와 거의 동등, 경진대회 최우수팀(16.4%)을 크게 상회
    • 시간 무제약 조건: 33.5% → 인간 전문가 최고 성능(77.8%)에는 여전히 미치지 못함
    • LLM 역할별 성능: Claude 3.7 Sonnet, Gemini 2.5 Pro, o3이 주요 에이전트로 우수, GPT-4o와 Gemini 2.0 Flash는 보조 역할에서 효과적
  3. 경진대회 기반 상세 비교 분석: DO Challenge 2025 참가 40개 팀 중 선발 20개 팀의 다양한 전략(능동 학습, 어텐션 기반 모델, 반복적 제출 등) 분석 및 인간 전문가 참조 솔루션과의 체계적 비교

How

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 신약 발견 맥락에서 AI 에이전트의 통합적 능력을 평가하는 신규 벤치마크를 제시하고, 멀티-에이전트 시스템의 경쟁력 있는 성능을 입증했다는 점에서 의미 있으나, 시간 무제약 조건에서의 인간 전문가와의 큰 격차와 높은 불안정성은 현재 AI 에이전트가 실제 신약 발견 자동화에는 아직 부족함을 시사한다.

같이 보면 좋은 논문

기반 연구
AI 에이전트 기반 약물 발견 파이프라인의 기반을 제공한다
기반 연구
RAG 강화 협력 LLM 에이전트의 신약 발견 적용 연구가 DO Challenge 벤치마크 설계에 기초가 되었음
기반 연구
AI 에이전트의 약물 발견 파이프라인 설계 가능성에 대한 기초 연구가 PharmAgents의 가상 제약회사 구현에 이론적 토대
기반 연구
전체 실험실 오케스트레이션 플랫폼이 AI 에이전트 기반 신약 발견 파이프라인 설계의 하드웨어-소프트웨어 통합 기반을 제공함
다른 접근
AI 에이전트를 활용한 신약 발견에서 파이프라인 설계와 프로그래밍 자동화라는 서로 다른 접근법 비교가 가능함
다른 접근
AI 기반 약물 발견 파이프라인의 다른 접근 방식으로, 멀티에이전트 통합과 단일 시스템 설계를 비교하여 최적 아키텍처를 도출할 수 있습니다.
후속 연구
AI 에이전트를 통한 약물 발견 파이프라인으로 유전자 편집 자동화를 확장한다
후속 연구
약물 반응 평가에서 전체 약물 발견 파이프라인 설계로 확장된 연구
후속 연구
자율 AI 에이전트 기반 신약 발견을 실험실 전체 오케스트레이션으로 확장한 통합 플랫폼 연구임
응용 사례
AI 에이전트의 약물 발견 파이프라인 설계 능력이 UniMatch의 few-shot 약물 발견 프레임워크에 직접 적용될 수 있다.
응용 사례
AI 에이전트가 약물 발견 파이프라인을 설계하는 실제 응용에서 항체 설계 기술을 활용할 수 있다
응용 사례
AI 에이전트를 약물 발견 파이프라인에 적용한 구체적 사례
← 목록으로 돌아가기