저자: Siyi Liu, Chen Gao, Yong Li | 날짜: 2024 | DOI: [미제공]
본 논문은 LLM(Large Language Model) 기반 에이전트에 사례기반추론(CBR, Case-Based Reasoning)을 통합하여 자동 데이터 과학(Automated Data Science) 작업, 특히 하이퍼파라미터 최적화를 수행하는 DS-Agent 프레임워크를 제안한다. 개발 단계에서 Kaggle의 전문가 지식을 활용하여 반복적 개선을 이루고, 배포 단계에서 저자원 환경에서도 효과적으로 작동한다.
Figure 1: DS-Agent의 개요 (a) 및 반복 단계에 따른 성능 개선 곡선 (b)
sim(τ, c) = cos(E(τ), E(c))CBR 기반 LLM의 반복 루프:
$$p_{CBR}(y_t|\tau) = \sum_{l_{t-1}} p_E(l_{t-1}|\tau) \sum_{c_t} p_R(c_t|\tau, l_{t-1}) p_{LLM}(y_t|c_t, \tau, l_{t-1})$$
RAG와의 차별점: CBR은 피드백 기반 동적 조정과 성공한 솔루션의 유지를 통해 반복적 학습 가능 vs. RAG는 단일 검색만 수행
총평: DS-Agent는 CBR-LLM 통합을 통해 자동 데이터 과학의 실질적 문제를 해결하고 우수한 실증 결과를 달성했으나, 사례 의존성, 제한된 일반화 가능성, 기술적 깊이 면에서 보완 여지가 있다. 실무 배포 관점에서는 높은 가치가 있으나, 기술적 혁신성 측면에서는 기존 기법의 조합에 가까운 평가를 받는다.