Retrieval-Augmented Generation for Large Language Models: A Survey

저자: Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jin Pan | 날짜: 2023 | DOI: N/A


Essence

Figure 2

그림 2: 질의응답에 적용된 RAG 프로세스 - 인덱싱, 검색, 생성의 3단계

대규모 언어모델(LLM)의 환각(hallucination), 지식 노후화, 추론 과정의 불투명성을 해결하기 위해 외부 데이터베이스에서 관련 정보를 검색하여 생성 과정을 보강하는 Retrieval-Augmented Generation (RAG) 기술을 종합적으로 분석한 논문이다. 본 논문은 RAG의 발전 단계를 Naive RAG, Advanced RAG, Modular RAG로 체계화하고 각 단계의 핵심 기술과 평가 방법론을 상세히 제시한다.

Motivation

Achievement

Figure 1

그림 1: RAG 연구의 기술 트리 - 사전학습, 파인튜닝, 추론 단계별 RAG 적용

Figure 3

그림 3: 세 가지 RAG 패러다임 비교 - Naive RAG(순차적), Advanced RAG(최적화), Modular RAG(모듈식)

  1. 체계적 패러다임 분류:
    • Naive RAG: 인덱싱 → 검색 → 생성의 기본 3단계 프로세스로 단순하지만 검색 정확도, 생성 환각, 정보 통합의 문제 존재
    • Advanced RAG: 사전 검색 최적화(쿼리 재작성, 확장) 및 사후 검색 처리(재순위화, 컨텍스트 압축)로 Naive RAG의 한계 보완
    • Modular RAG: 모듈식 설계로 반복 검색, 적응형 검색, 모듈 교체 등 유연한 구조 제공
  2. 핵심 기술 통합 분석:
    • 임베딩 최적화, 인덱싱 기법, 쿼리 변환, 재순위화, 컨텍스트 압축, 파인튜닝 등 각 단계별 세부 기술 분류
    • 검색과 생성 간의 시너지 효과 및 각 기술의 상호작용 메커니즘 명시
  3. 포괄적 평가 체계 제시:
    • 26개 다운스트림 태스크, 약 50개 데이터셋 및 평가 지표 정리
    • 현존 벤치마크(TREC, MS MARCO, SQuAD 등) 및 평가 도구 분류

How

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 RAG 분야의 최초 대규모 종합 조사로서 체계적인 분류 체계와 기술 트리를 제시하여 학계와 산업계의 RAG 이해를 크게 향상시킨 의미 있는 기여를 했다. 다만 개별 기술의 정량적 성능 비교와 실무 적용 시 의사결정 가이드라인이 보강되면 더욱 가치 있는 자료가 될 것이다.

같이 보면 좋은 논문

기반 연구
긴 추론 체인 생성을 위해서는 검색 증강 생성 기술이 핵심 기반 기술로 필요하다.
기반 연구
도구 학습 벤치마크에서 필요한 외부 정보 검색 및 통합 기술의 이론적 기반을 제공한다.
후속 연구
검색 증강 생성 방법론을 장문 생성과 편향 분석으로 확장한 연구입니다.
후속 연구
일반적인 RAG 기술을 과학 문헌 검색에 특화한 PaperQA와 같은 구체적 응용으로 확장한다.
후속 연구
검색 증강 생성의 기본 개념을 LLM이 자동으로 검색 시점을 결정하는 고도화된 형태로 발전시킨다.
응용 사례
검색 증강 생성 기술이 긴 추론 체인 생성에 핵심적으로 활용되는 구체적 응용 사례를 보여준다.
응용 사례
안정적 벤치마크에서 RAG 기술을 활용한 도구 선택 및 활용 능력을 평가할 수 있다.
← 목록으로 돌아가기