SurveyX: Academic survey automation via large language models

저자: Xun Liang, Jiawei Yang, Yezhaohui Wang, Chen Tang, Zifan Zheng, Shichao Song, Zehao Lin, Yebin Yang, Simin Niu, Hanyu Wang, Bo Tang, Feiyu Xiong, Keming Mao, Zhiyu Li | 날짜: 2025 | DOI: arXiv:2502.14776


Essence

Figure 2

SurveyX의 전체 파이프라인: 준비 단계(Part 1: 논문 검색 및 자료 전처리)와 생성 단계(Part 2: 논문 작성 및 개선)로 구성

arXiv에 매년 증가하는 학술 논문의 폭증 속에서, 대형언어모델(LLM)을 활용하여 체계적이고 고품질의 학술 서베이를 자동 생성하는 SurveyX 시스템을 제안한다. 이 시스템은 온라인 참고문헌 검색, AttributeTree 전처리 방법, 그리고 다단계 최적화를 통해 기존 자동 서베이 생성 시스템의 한계를 극복한다.

Motivation

Achievement

Figure 1

arXiv 웹사이트의 연간 논문 수 추이(2010-2025): 2025년 제출 건수는 2010년의 5배 이상으로 예상

  1. 높은 품질의 콘텐츠: 자동 생성 서베이의 콘텐츠 품질을 0.259 포인트 향상시켜 기존 시스템(AutoSurvey)을 능가함.
  2. 향상된 인용 품질: 참고문헌 품질을 1.76 포인트 개선하여 학술적 엄밀성 증대.
  3. 인간 전문가 수준에 근접: 다양한 평가 차원에서 인간 전문가의 성과에 근접한 성능 달성.
  4. 풍부한 표현 형식: 텍스트, 도표, 표, 그림 등 다양한 시각화 요소 포함으로 가독성 향상.

How

Figure 2

SurveyX 파이프라인의 상세 구성: Part 1은 11단계, Part 2는 11단계로 순차적으로 진행

준비 단계 (Preparation Phase):

생성 단계 (Generation Phase):

Originality

Limitation & Further Study

Evaluation

총평: SurveyX는 LLM 기반 자동 서베이 생성의 실용적 한계를 체계적으로 해결하고, 온라인 검색, 지능형 전처리, 멀티모달 확장을 통해 기존 AutoSurvey 대비 명확한 성능 향상을 입증한 의미 있는 연구이나, 평가의 포괄성과 방법론의 이론적 깊이 강화가 필요하다.

같이 보면 좋은 논문

기반 연구
자동 문헌 리뷰 생성을 위한 대규모 데이터셋이 SurveyX 시스템의 성능 평가와 개선에 필요한 기준점을 제공한다.
후속 연구
과학 논문을 위한 멀티에이전트 리뷰 생성이 SurveyX의 서베이 자동화를 동료 평가 영역으로 확장한 발전된 형태이다.
응용 사례
다수 학술 논문의 구조화된 요약 생성이 SurveyX 시스템의 자동 서베이 생성 기능을 보완하는 구체적 응용 사례이다.
← 목록으로 돌아가기