저자: Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jin Pan | 날짜: 2023 | DOI: N/A
그림 2: 질의응답에 적용된 RAG 프로세스 - 인덱싱, 검색, 생성의 3단계
대규모 언어모델(LLM)의 환각(hallucination), 지식 노후화, 추론 과정의 불투명성을 해결하기 위해 외부 데이터베이스에서 관련 정보를 검색하여 생성 과정을 보강하는 Retrieval-Augmented Generation (RAG) 기술을 종합적으로 분석한 논문이다. 본 논문은 RAG의 발전 단계를 Naive RAG, Advanced RAG, Modular RAG로 체계화하고 각 단계의 핵심 기술과 평가 방법론을 상세히 제시한다.
그림 1: RAG 연구의 기술 트리 - 사전학습, 파인튜닝, 추론 단계별 RAG 적용
그림 3: 세 가지 RAG 패러다임 비교 - Naive RAG(순차적), Advanced RAG(최적화), Modular RAG(모듈식)
총평: 본 논문은 RAG 분야의 최초 대규모 종합 조사로서 체계적인 분류 체계와 기술 트리를 제시하여 학계와 산업계의 RAG 이해를 크게 향상시킨 의미 있는 기여를 했다. 다만 개별 기술의 정량적 성능 비교와 실무 적용 시 의사결정 가이드라인이 보강되면 더욱 가치 있는 자료가 될 것이다.