Augmented Language Models: a Survey

저자: G. Mialon, Roberto Dessì, M. Lomeli, Christoforos Nalmpantis, Ramakanth Pasunuru | 날짜: 2023 | DOI: arXiv:2302.07842


Essence

본 논문은 언어 모델(Language Models, LMs)을 추론 능력과 도구 사용 능력으로 확대하는 증강 언어 모델(Augmented Language Models, ALMs)에 대한 포괄적인 조사 논문이다. ALMs는 복잡한 작업을 단순한 부작업으로 분해하거나 외부 모듈(코드 인터프리터, 검색 엔진 등)을 활용하여 기존 LMs의 해석 가능성, 일관성, 확장성 문제를 해결할 수 있다.

Motivation

Achievement

Figure 1
Figure 2
  1. 추론 능력 강화:
    • 프롬팅을 통한 추론 유도(Chain-of-Thought, 재귀적 프롬팅)
    • 작업 메모리(Working Memory)와 반복적 프롬팅 활용
    • 명시적 학습을 통한 추론 능력 개선
  2. 도구 활용 확대:
    • 다른 모델 호출, 정보 검색(문서 검색, 검색 엔진, 웹 네비게이션)
    • 코드 인터프리터와 기호 모듈을 통한 계산
    • 가상/물리 세계에 대한 행동(로봇 조작 등)
  3. 학습 방법론 다양화:
    • 지도 학습(Supervision), 강화 학습(Reinforcement Learning)을 통한 ALM 학습
    • 휴리스틱 기반 접근과 학습 기반 접근의 비교

How

Figure 3
Figure 4
Figure 5

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.4/5

총평: 본 논문은 빠르게 발전하는 ALM 분야를 체계적으로 정리한 우수한 서베이로, 추론과 도구 사용을 통합적으로 다루고 명확한 분류체계를 제시하여 커뮤니티에 실질적 기여를 한다. 다만 일부 핵심 개념의 철학적 기초가 여전히 명확하지 않다는 한계가 있다.

같이 보면 좋은 논문

기반 연구
도구 사용 능력을 갖춘 증강 모델이 데이터 사이언스 에이전트의 핵심 설계 원리가 된다
기반 연구
LLM을 외부 도구로 활용하는 증강 모델 개념이 진화 알고리즘과의 결합에 기초가 된다
기반 연구
증강 언어모델의 이론적 기반이 뇌과학 영감을 받은 파운데이션 에이전트 설계에 핵심이다
후속 연구
외부 모듈 활용 개념을 화학 공간 탐색의 진화 알고리즘과 결합한 확장된 형태이다
응용 사례
증강 언어모델의 추론과 도구 사용 개념이 뇌과학 기반 에이전트 설계에 적용되었다
← 목록으로 돌아가기