From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

저자: M. Ferrag, N. Tihanyi, M. Debbah | 날짜: 2025 | DOI: 10.48550/arXiv.2504.19678


Essence

Figure 1

논문의 구조: LLM 벤치마크부터 AI 에이전트 프로토콜까지 포괄적 범주화

본 논문은 2019년부터 2025년까지 개발된 약 60개의 LLM 및 자율 AI 에이전트(Autonomous AI Agents) 벤치마크를 체계적으로 통합하고, 2023-2025년 주요 에이전트 프레임워크와 실제 응용 사례를 종합적으로 리뷰한다. 특히 다중 에이전트 협력 프로토콜(Agent Communication Protocol, Model Context Protocol, Agent-to-Agent Protocol)을 조사하며 미래 연구 방향을 제시한다.

Motivation

Achievement

Figure 2

LLM 벤치마크의 분류: 일반 지식, 수학, 코드 생성, 다중모달 등 8개 카테고리

  1. 포괄적 벤치마크 비교: 약 60개의 LLM 및 에이전트 벤치마크를 다음 8개 카테고리로 분류 - (1) 일반 및 학술 지식 추론, (2) 수학 문제 해결, (3) 코드 생성 및 소프트웨어 엔지니어링, (4) 팩트 그라운딩 및 검색, (5) 도메인 특화 평가, (6) 다중모달 및 embodied 작업, (7) 태스크 오케스트레이션, (8) 인터랙티브 평가
  2. AI 에이전트 프레임워크 통합: 2023-2025년 개발된 주요 프레임워크들을 모듈식 툴킷 통합, 자율 의사결정, 다단계 추론 능력에 따라 체계화
  3. 다중 도메인 응용 사례: 재료과학, 바이오의료 연구, 학술 아이디어 생성, 소프트웨어 엔지니어링, 합성 데이터 생성, 화학 추론, 수학 문제 해결, 지리정보시스템(GIS), 멀티미디어, 의료, 금융 등 11개 영역의 실제 적용 사례 제시
  4. 에이전트 협력 프로토콜 조사: Agent Communication Protocol(ACP), Model Context Protocol(MCP), Agent-to-Agent Protocol(A2A) 3가지 주요 프로토콜 상세 분석

How

Figure 3

AI 에이전트의 핵심 요소: 인지(Perception), 기억(Memory), 행동(Action)

Figure 4

Agentic 워크플로우: 반사-계획-행동-평가 순환 구조

Figure 5

에이전트 기반 RAG 프레임워크: 동적 정보 검색과 반복적 정제

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 LLM과 자율 AI 에이전트 분야의 빠른 기술 발전으로 인한 단편화 문제를 체계적인 분류체계, 종합적 비교 분석, 다양한 응용 사례를 통해 효과적으로 통합하는 중요한 리뷰 논문이다. 특히 다중 에이전트 협력 프로토콜 분석과 구체적 미래 연구 방향 제시가 학계와 산업계에 실질적 가치를 제공하나, 일부 전문 분야(보안, 멀티 에이전트 실패 분석)에서는 더욱 심화된 분석이 필요하다.

같이 보면 좋은 논문

기반 연구
자율 AI 에이전트에 대한 포괄적 조사가 LLM 추론에서 에이전트로의 발전 리뷰의 이론적 배경을 제공합니다.
기반 연구
LLM 에이전트 포괄 리뷰에서 제시된 작업 메모리 개념이 장기 과제의 계층적 메모리 관리로 구체화됩니다.
다른 접근
LLM 추론에서 자율 AI 에이전트로의 포괄적 설문과 LLM 에이전트 계획에 대한 설문은 상호 보완적인 관점을 제시한다.
후속 연구
에이전트 프레임워크 리뷰에서 제시된 작업 메모리 관리가 장기 수평 과제의 구체적 해결방안으로 발전됩니다.
응용 사례
멀티 에이전트 이론을 실제 LLM 애플리케이션 개발 프레임워크에 적용한 구체적 사례입니다.
← 목록으로 돌아가기