OpenReview Should be Protected and Leveraged as a Community Asset for Research in the Era of Large Language Models

저자: Hao Sun, Yunyi Shen, Mihaela van der Schaar | 날짜: 2025 | DOI: 10.48550/arXiv.2505.21537


Essence

Figure 1

OpenReview 데이터 생성 과정(좌), 피어리뷰 규제, LLM 오픈-엔디드 작업 연구, 정렬 및 추론 후훈련을 지원하는 세 가지 주요 응용 분야(중), 연구 기회(우)

대규모 언어모델(LLM) 시대에 OpenReview 플랫폼—논문, 리뷰, 저자 반박, 메타리뷰, 최종 결정을 포함한 구조화된 전문가 피드백 저장소—을 학술 공동체의 핵심 자산으로 보호하고 활용해야 함을 주장하는 입장 논문이다.

Motivation

Achievement

Figure 2

ICLR (2017–2025) 성장 추세: 투고 수는 500→11,600, 저자는 1,500→38,500, 리뷰어는 1,000→18,300으로 증가했으나 리뷰어 증가가 투고 증가를 따라가지 못함

  1. 규모와 구조 분석: ICLR을 사례로 2017-2025년 간 36,000+의 상호작용 스레드, 100,000+의 리뷰 데이터 축적을 정량화. 리뷰어 부족 문제(리뷰어 증가 24-25년 약 2,000명 vs 투고 계속 증가)를 시각화.
  2. 데이터셋 우월성 입증: OpenReview를 기존 요약(See et al. 2017, 310K), 정렬/대화(Bai et al. 2022a, 170K) 등 관련 데이터셋과 비교하여 유일하게 '전문가 생성', '지속적 업데이트', '오픈-엔디드' 모두를 만족함을 Table 1에서 제시.
  3. 세 가지 응용 기회 체계화:
    • 피어리뷰 보조: 리뷰어 초안 작성, 점수 조정, 논증 갭 식별, 응답 요약 지원
    • 벤치마킹: 학술 글쓰기, 연구 평가, 설득, 요약 등 오픈-엔디드 작업 평가
    • 정렬 연구: 증거 기반 논증, 불일치 처리, 합의 구축을 통한 다차원 정렬

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3.5/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4/5

총평: 학술 공동체의 피어리뷰 데이터를 LLM 시대의 핵심 자산으로 재조명한 중요한 입장 논문이나, 윤리적 고려사항과 구현 세부사항이 보강되어야 완전한 실행 가능성을 확보할 수 있다. 특히 OpenReview 보호와 공동체적 관리 방식에 대한 구체적 제안이 후속 작업에서 필요하다.

같이 보면 좋은 논문

기반 연구
심사위원 배정 시스템 취약점이 OpenReview 플랫폼 보호 필요성을 뒷받침하는 구체적 근거가 된다
기반 연구
OpenReview 보호 필요성이 arXiv 철회 연구와 함께 학술 출판 플랫폼의 신뢰성 보장 방안을 제시한다.
기반 연구
OpenReview 플랫폼 보호가 AI 학술대회 리뷰 위기 해결을 위한 데이터 인프라 기반이 된다
후속 연구
OpenReview를 학술 공동체 자산으로 보호하는 것이 AI 학술대회 리뷰 위기 해결의 장기적 방향이다
응용 사례
OpenReview 플랫폼 보호 필요성을 뒷받침하는 구체적인 보안 위험 사례를 제공한다
응용 사례
OpenReview 플랫폼의 구조화된 피드백 데이터가 다중턴 리뷰 대화 시스템 구축에 활용된다
← 목록으로 돌아가기