저자: M. Ferrag, N. Tihanyi, M. Debbah | 날짜: 2025 | DOI: 10.48550/arXiv.2504.19678
논문의 구조: LLM 벤치마크부터 AI 에이전트 프로토콜까지 포괄적 범주화
본 논문은 2019년부터 2025년까지 개발된 약 60개의 LLM 및 자율 AI 에이전트(Autonomous AI Agents) 벤치마크를 체계적으로 통합하고, 2023-2025년 주요 에이전트 프레임워크와 실제 응용 사례를 종합적으로 리뷰한다. 특히 다중 에이전트 협력 프로토콜(Agent Communication Protocol, Model Context Protocol, Agent-to-Agent Protocol)을 조사하며 미래 연구 방향을 제시한다.
LLM 벤치마크의 분류: 일반 지식, 수학, 코드 생성, 다중모달 등 8개 카테고리
AI 에이전트의 핵심 요소: 인지(Perception), 기억(Memory), 행동(Action)
Agentic 워크플로우: 반사-계획-행동-평가 순환 구조
에이전트 기반 RAG 프레임워크: 동적 정보 검색과 반복적 정제
총평: 본 논문은 LLM과 자율 AI 에이전트 분야의 빠른 기술 발전으로 인한 단편화 문제를 체계적인 분류체계, 종합적 비교 분석, 다양한 응용 사례를 통해 효과적으로 통합하는 중요한 리뷰 논문이다. 특히 다중 에이전트 협력 프로토콜 분석과 구체적 미래 연구 방향 제시가 학계와 산업계에 실질적 가치를 제공하나, 일부 전문 분야(보안, 멀티 에이전트 실패 분석)에서는 더욱 심화된 분석이 필요하다.