저자: Shaolei Zhang, Ju Fan, Meihao Fan, Guoliang Li, Xiaoyong Du | 날짜: 2025-10-19 | DOI: 미제공
DeepAnalyze-8B: 데이터 소스에서 분석가급 리포트까지 엔드-투-엔드 자동 데이터 과학을 수행하는 에이전틱 LLM
본 논문은 원시 데이터에서 분석가급 심층 연구 보고서까지 완전 자동화된 데이터 과학(autonomous data science)을 달성하는 최초의 에이전틱 LLM인 DeepAnalyze-8B를 제안한다. 단 8B 파라미터로 고급 독점 LLM 기반의 기존 워크플로우 에이전트를 능가하는 성능을 보여준다.
DeepAnalyze 아키텍처: 자율 조율(autonomous orchestration)과 적응형 최적화(adaptive optimization) 능력을 갖춘 에이전틱 시스템
에이전틱 강화학습(Agentic RL) 개요: 환경과의 상호작용을 통한 피드백 기반 학습
데이터 기반 궤적 합성 프레임워크: 고품질 훈련 데이터 구성 프로세스
총평: DeepAnalyze는 자동화된 데이터 과학을 향한 실질적이고 중요한 첫 걸음을 제시하며, 커리큘럼 기반 훈련과 데이터 기반 궤적 합성은 LLM 에이전트 훈련의 새로운 패러다임을 제안한다. 8B 모델로 대형 독점 모델을 능가하는 효율성과 완전 공개 전략은 의의가 크지만, 다양한 도메인과 복잡한 실제 환경에서의 강건성 검증과 평가 메트릭 확충이 후속 개선 과제이다.