DeepAnalyze: Agentic Large Language Models for Autonomous Data Science

저자: Shaolei Zhang, Ju Fan, Meihao Fan, Guoliang Li, Xiaoyong Du | 날짜: 2025-10-19 | DOI: 미제공


Essence

Figure 1

DeepAnalyze-8B: 데이터 소스에서 분석가급 리포트까지 엔드-투-엔드 자동 데이터 과학을 수행하는 에이전틱 LLM

본 논문은 원시 데이터에서 분석가급 심층 연구 보고서까지 완전 자동화된 데이터 과학(autonomous data science)을 달성하는 최초의 에이전틱 LLM인 DeepAnalyze-8B를 제안한다. 단 8B 파라미터로 고급 독점 LLM 기반의 기존 워크플로우 에이전트를 능가하는 성능을 보여준다.

Motivation

Achievement

Figure 3

DeepAnalyze 아키텍처: 자율 조율(autonomous orchestration)과 적응형 최적화(adaptive optimization) 능력을 갖춘 에이전틱 시스템

  1. 엔드-투-엔드 자동화: 데이터 준비(data preparation), 분석(analysis), 모델링(modeling), 시각화(visualization), 리포트 생성까지 전체 파이프라인을 자동으로 완성
  2. 다양한 데이터 작업 지원: 데이터 질문 답변(data QA), 특화된 분석 작업(specialized analytics), 개방형 데이터 연구(open-ended data research) 등 광범위한 데이터 과학 작업 수행
  3. 우수한 성능: 8B 파라미터로 최고급 독점 LLM 기반의 기존 워크플로우 에이전트 능가
  4. 완전 공개: 모델, 코드, 훈련 데이터(DataScience-Instruct-500K) 전량 오픈소스 제공

How

Figure 4

에이전틱 강화학습(Agentic RL) 개요: 환경과의 상호작용을 통한 피드백 기반 학습

Figure 5

데이터 기반 궤적 합성 프레임워크: 고품질 훈련 데이터 구성 프로세스

Originality

Limitation & Further Study

Evaluation

총평: DeepAnalyze는 자동화된 데이터 과학을 향한 실질적이고 중요한 첫 걸음을 제시하며, 커리큘럼 기반 훈련과 데이터 기반 궤적 합성은 LLM 에이전트 훈련의 새로운 패러다임을 제안한다. 8B 모델로 대형 독점 모델을 능가하는 효율성과 완전 공개 전략은 의의가 크지만, 다양한 도메인과 복잡한 실제 환경에서의 강건성 검증과 평가 메트릭 확충이 후속 개선 과제이다.

같이 보면 좋은 논문

다른 접근
8B 파라미터 특화 모델과 범용 대규모 모델을 활용한 데이터 과학 자동화의 서로 다른 접근법을 비교할 수 있다
다른 접근
에이전틱 접근법과 일반적인 LLM 기반 데이터 해석의 서로 다른 자동화 방법론을 비교할 수 있다
응용 사례
MLE-bench에서 평가된 머신러닝 자동화 역량이 실제 데이터 과학 에이전트로 구현된 구체적 사례이다
응용 사례
MLE-bench에서 평가된 자동화 역량이 실제 데이터 과학 에이전트로 구현된 사례를 확인할 수 있다
← 목록으로 돌아가기