R&D-Agent: Automating Data-Driven AI Solution Building Through LLM-Powered Automated Research, Development, and Evolution

저자: Xu Yang, Xiao Yang, Shikai Fang, Bowen Xian, Yuante Li, Jian Wang, Minrui Xu, Haoran Pan, Xinpeng Hong, Weiqing Liu, Yelong Shen, Weizhu Chen, Jiang Bian | 날짜: 2025-05-20 | DOI: 10.48550/arXiv.2505.14738


Essence

Figure 1

R&D-Agent 프레임워크: 연구자(Researcher) 에이전트와 개발자(Developer) 에이전트가 협력하여 다중 탐색 경로를 병렬로 실행하고 상호 강화하는 구조

본 논문은 LLM 기반의 이중 에이전트 프레임워크인 R&D-Agent를 제안하여, 데이터 과학 솔루션 개발을 자동화하고 전문가 수준의 성능에 근접하도록 설계했다. 연구자 에이전트는 성능 피드백을 바탕으로 아이디어를 생성하고, 개발자 에이전트는 오류 피드백을 바탕으로 코드를 개선하는 협력적 탐색 과정을 통해 기존 자동화 솔루션의 한계를 극복한다.

Motivation

Achievement

  1. 최고 성능 달성: MLE-Bench 벤치마크에서 기계 학습 엔지니어링 에이전트 중 최우수 성능 달성
  2. 이중 에이전트 설계의 효율성: 역할 분담을 통해 적합한 LLM 모델 할당 가능 (예: o1은 추론/아이디어 생성, GPT-4.1은 명령 추종/구현)
  3. 다중 탐색 경로의 상호 강화: 평행 탐색 흔적(traces)의 선택적 병합(fusion)을 통해 개별 해보다 우수한 합성 솔루션(composite solution) 생성
  4. 개발 효율성 향상: 샘플 데이터셋에서의 반복 디버깅 → 전체 데이터셋 실행의 이단계 접근으로 개발 속도 대폭 개선
  5. 오픈소스 공개: GitHub에서 코드 공개로 재현성 및 접근성 확보

How

이중 역할 전담(Dedicated R&D Role)

다중 탐색 경로 탐색(Multi-Trace Idea Exploration)

다중 탐색 경로 융합(Multi-Trace Fusion for Stronger Solutions)

유연한 제어

Originality

Limitation & Further Study

Evaluation

총평: R&D-Agent는 LLM 기반 데이터 과학 자동화의 중요한 진전을 이루었으며, 이중 에이전트 설계와 다중 추적 병합이라는 창신적 개념을 통해 기존 솔루션의 한계를 극복하려는 시도가 높이 평가된다. 다만, 계산 비용 분석, 실무 적용 사례, 핵심 메커니즘의 세부 기술 설명이 보강되면 논문의 실용성과 완성도가 더욱 향상될 것으로 예상된다.

← 목록으로 돌아가기