Summarizing multiple documents with conversational structure for meta-review generation

저자: Miao Li, Eduard Hovy, Jey Han Lau | 날짜: 2023 | DOI: arXiv:2305.01498


Essence

Figure 1

계층적 대화 구조를 가진 PEERSUM 데이터셋 예시: 공식 리뷰, 저자 응답, 공개 리뷰 등이 스레드 형태로 조직됨

학술 논문 심사 과정에서 메타리뷰(meta-review)를 자동 생성하기 위해 리뷰어들의 상충된 의견과 다중 순환 대화를 포함한 계층적 구조를 갖춘 새로운 다중문서 요약 데이터셋(PEERSUM)과 이를 활용하는 관계-인식 모델(RAMMER)을 제안한다.

Motivation

Achievement

Figure 1

PEERSUM의 계층적 구조: 공식 리뷰 스레드, 저자 응답, 공개 리뷰, 논문 초록 등이 트리 구조로 구성됨 (평균 높이 3.63, 너비 5.31)

  1. PEERSUM 데이터셋: 14,993개 샘플(ICLR 2018-2022, NeurIPS 2021-2022)로 구성. 기존 MDS 데이터셋과 달리:
    • 명시적 계층적 대화 구조 포함
    • 높은 추상성(abstractiveness): 유니그램 42%, 바이그램 77%, 트라이그램 81%가 소스 문서에 없음
    • 신뢰도 높음(faithfulness): 메타리뷰가 소스 문서를 충실히 반영
    • 상충 샘플 13.6%: 리뷰 평점 차이 ≥4인 경우 명시적 표시
  2. RAMMER 모델의 성능: 자동 평가 메트릭(ROUGE, 논문 수용 여부 예측 기반 메트릭)에서 기준 모델들을 능가

How

Originality

Limitation & Further Study

Evaluation

총평: 복잡한 구조와 상충하는 정보를 다루는 현실적이고 도전적인 다중문서 요약 데이터셋을 제시한 점에서 학술적 기여도가 높으나, 제안된 모델이 핵심 문제(상충 해결)를 해결하지 못함을 보여주어 향후 연구의 방향을 명확히 제시한다.

같이 보면 좋은 논문

기반 연구
대화 구조를 가진 다중 문서 요약 기법이 리뷰 의견 종합에 적용된다
다른 접근
대화 구조 기반 메타리뷰 생성과 다중 에이전트 기반 리뷰 생성이라는 서로 다른 접근법
후속 연구
학술 심사의 메타리뷰 생성을 AI 생성 과학논문의 자동 평가 지표로 확장한 응용
응용 사례
대화 구조를 활용한 다중 문서 요약 기법을 과학 문서에 적용한 사례입니다.
← 목록으로 돌아가기