Understanding the planning of LLM agents: A survey

저자: Xu Huang, Weiwen Liu, Xiaolong Chen, Xingmei Wang, Hao Wang 외 | 날짜: 2024 | DOI: 10.48550/arXiv.2402.02716


Essence

Figure 1: Taxonomy on LLM-Agent planning

LLM 기반 에이전트 계획 수립의 5가지 주요 분류

본 논문은 대규모 언어모델(LLM)을 자율 에이전트의 계획 모듈로 활용하는 최신 연구들을 체계적으로 분석한 첫 번째 종합 설문 논문이다. 기존의 기호 기반 방법과 강화학습 기반 방법의 한계를 극복하기 위해 LLM의 추론 및 도구 활용 능력을 활용한 계획 수립 방법들을 5가지 범주로 분류하여 상세히 분석한다.

Motivation

Achievement

Figure 2: Types of task decomposition manners

작업 분해의 두 가지 방식: (a) 분해-우선 방식과 (b) 인터리빙 방식

  1. 체계적 분류 체계 제시: 기존에 산발적으로 연구되던 LLM 기반 에이전트 계획 방법들을 작업 분해(Task Decomposition), 다중 계획 선택(Multi-plan Selection), 외부 모듈 활용(External Planner-aided Planning), 반사 및 개선(Reflection & Refinement), 메모리 증강 계획(Memory-augmented Planning) 5가지로 체계적으로 분류
  2. 각 방향별 상세 분석: 각 범주에 대해 동기, 기본 아이디어, 대표 방법들(CoT, ReAct, HuggingGPT, Plan-and-Solve 등), 장단점을 포괄적으로 논의
  3. 공식적 문제 표현: 각 방법을 수학적으로 명확히 표현하여 상이한 접근 방식 간의 본질적 차이를 명확히 함
  4. 종합적 벤치마크 평가: 4개의 주요 벤치마크에서 대표 방법들을 평가하여 실증적 비교 제공

How

작업 분해(Task Decomposition) 방법

다중 계획 선택(Multi-plan Selection)

외부 모듈 활용(External Planner-aided Planning)

반사 및 개선(Reflection & Refinement)

메모리 증강 계획(Memory-augmented Planning)

Originality

Limitation & Further Study

현재 한계점

후속 연구 방향

Evaluation

총평: 본 논문은 급속히 발전하는 LLM 기반 에이전트 계획 분야에 대한 첫 체계적 종합 분석을 제공하며, 5가지 명확한 분류 체계와 상세한 기술적 분석을 통해 커뮤니티에 중요한 참고자료가 될 것으로 평가된다. 향후 각 방향의 한계 극복과 방법론 간 결합 연구가 핵심 과제가 될 것으로 예상된다.

같이 보면 좋은 논문

기반 연구
대규모 언어모델을 활용한 전략적 추론 설문이 LLM 에이전트 계획 연구의 이론적 토대를 제공한다.
다른 접근
LLM 추론에서 자율 AI 에이전트로의 포괄적 설문과 LLM 에이전트 계획에 대한 설문은 상호 보완적인 관점을 제시한다.
다른 접근
LLM 에이전트의 계획 이해에 대한 두 서베이가 서로 다른 관점에서 계획 능력을 분석한다.
후속 연구
PlanGenLLMs의 LLM 계획 능력 조사를 에이전트 계획이라는 더 구체적 영역으로 심화한 연구이다.
응용 사례
LLM 기반 자율 에이전트 전반에 대한 설문을 계획 모듈이라는 특정 구성요소에 집중하여 분석한 연구이다.
← 목록으로 돌아가기