저자: Cheng Tan, Dongxin Lyu, Siyuan Li, Zhangyang Gao, Jingxuan Wei, Siqi Ma, Zicheng Liu, Stan Z. Li | 날짜: 2024-06-09 | DOI: 10.48550/arXiv.2406.05688
그림 1: 기존 LLM 피어리뷰 접근법과 개선된 프레임워크 비교
대규모언어모델(LLM)의 학술 논문 피어리뷰 과정을 단순한 정적 검토 생성에서 저자-검토자-의사결정자 간의 동적 다중턴 대화로 재정의하고, 92,017개의 검토문을 포함한 대규모 데이터셋(ReviewMT)을 구축했다.
그림 2: ReviewMT 데이터셋 데이터 처리 파이프라인 개요
그림 3: ReviewMT-ICLR 데이터셋의 ICLR 논문과 검토문 통계
그림 4: ReviewMT 데이터셋의 키워드 워드클라우드
총평: 이 논문은 대규모언어모델의 학술 피어리뷰 적용을 현실적 다중턴 대화 구조로 혁신적으로 재설정하고, 이를 뒷받침하는 대규모 고품질 데이터셋을 공개함으로써 학술 AI 응용의 중요한 기초를 제공한다. 다만 LLM 성능 평가 결과의 부재와 자동 평가 메트릭스의 미성숙이 시급한 과제이며, 실제 학술 생태계에 미치는 영향에 대한 심층 논의가 필요하다.