Agentomics-ML: Autonomous Machine Learning Experimentation Agent for Genomic and Transcriptomic Data

저자: Vlastimil Martinek, Andrea Gariboldi, Dimosthenis Tzimotoudis, Aitor Alberdi Escudero, Edward Blake, David Cechak, Luke Cassar, Alessandro Balestrucci, Panagiotis Alexiou | 날짜: 2025-06-05 | DOI: 미제공


Essence

Figure 1

Agentomics-ML의 아키텍처: 에이전트가 ML 개발 파이프라인의 사전정의된 단계를 따르면서 순차적으로 단계를 완료하여 최종적으로 작동하는 ML 모델을 출력한다.

LLM 기반 자율 에이전트를 게노믹 및 트랜스크립토믹 데이터 분류 작업에 특화시킨 시스템으로, 기존 대규모 언어 모델 에이전트 방법론을 초과하는 재현성과 일반화 성능을 달성한다.

Motivation

Achievement

  1. 높은 성공률 달성: Agentomics-ML이 93% 이상의 경우에서 작동하는 ML 코드 및 훈련된 모델을 성공적으로 생성하며, 다른 모든 최첨단 에이전트 기반 시스템이 실패하는 복잡한 데이터셋에서도 작동.
  2. 기존 에이전트 방법론 초과 성능: 기존 state-of-the-art 에이전트 기반 방법들(SELA, Data Interpreter, AIDE 등)의 일반화 성능과 성공률을 능가하며, 하나의 벤치마크 데이터셋에서 state-of-the-art 성능을 달성.
  3. 도메인 전문가 모델과의 격차 감소: 도메인 전문가가 구축한 모델의 절대 성능에는 미치지 못하지만, 완전 자율 시스템으로서의 격차를 현저히 축소.
  4. 재현성 보장: 훈련 및 추론을 위한 완전한 스크립트와 필요한 모든 아티팩트를 제공하여 전체 ML 워크플로우의 재현성 보장.

How

Originality

Limitation & Further Study

Evaluation

총평: Agentomics-ML은 게노믹 및 트랜스크립토믹 데이터의 ML 분석을 자동화하기 위해 도메인 특화 설계와 엄격한 평가 프레임워크를 결합한 의미 있는 기여를 제시하며, 기존 에이전트 기반 방법론을 현저히 초과하는 성능을 달성했으나, 도메인 전문가 모델과의 격차와 작업 범위의 제한성이 실무 활용성을 다소 제약한다.

같이 보면 좋은 논문

기반 연구
멀티모달 모델 특화 방법론이 게노믹 데이터 분석의 자율 ML 에이전트 개발에 기여하는 기반을 제공한다.
다른 접근
게노믹 데이터 분석에서 자율 ML 에이전트 접근과 딥러닝 기반 능동학습의 다른 방법론을 비교한다.
다른 접근
생물학적 데이터 분석에서 딥러닝 기반 능동학습과 자율 ML 에이전트의 다른 접근 방식을 보여준다.
다른 접근
생명과학 데이터 분석과 신약 자산 발굴에서 AI 에이전트 활용의 다른 접근 방식을 보여준다.
다른 접근
생명과학 분야 AI 적용에서 신약 자산 발굴과 게노믹 데이터 분석의 다른 접근 방식을 비교한다.
후속 연구
과학 영상 분류에서 멀티모달 모델 특화 방법론을 게노믹 데이터로 확장한 접근을 제시한다.
응용 사례
생물정보학 분야 기초 모델의 게노믹 및 트랜스크립토믹 데이터 분류 특화 적용을 보여준다.
응용 사례
생물정보학 기초 모델이 게노믹 데이터의 자율 ML 분석에 제공하는 기반 기술을 다룬다.
← 목록으로 돌아가기