Agentreview: Exploring peer review dynamics with llm agents

저자: Yiqiao Jin, Qinlin Zhao, Yiyang Wang, Hao Chen, Kaijie Zhu, Yijia Xiao, Jindong Wang | 날짜: 2024 | DOI: 미제공


Essence

Figure 1

AgentReview 프레임워크는 피어 리뷰 프로세스를 현실적으로 시뮬레이션하며, 다중 변수의 영향을 분리하여 분석한다.

본 논문은 대규모언어모델(LLM) 기반 에이전트를 활용하여 학술지 피어 리뷰 과정을 시뮬레이션하고, 검토자 편향(reviewer bias), 사회적 영향(social influence), 권위 편향(authority bias) 등 다양한 사회학적 요인이 리뷰 결정에 미치는 영향을 정량화하는 첫 번째 프레임워크를 제시한다.

Motivation

Achievement

Figure 2

5단계 피어 리뷰 파이프라인: (I) 검토자 평가, (II) 저자-검토자 토론, (III) 검토자-의장 토론, (IV) 메타리뷰 작성, (V) 최종 결정

  1. 사회적 영향(Social Influence): 리베탈(rebuttal) 이후 검토자들이 동료의 의견에 맞추는 현상을 확인하였으며, 이로 인해 평점의 표준편차가 27.2% 감소한다.
  2. 검토자 편향의 결정적 영향: 단 1명의 편향된 검토자만으로도 최종 결정의 37.1%가 변경되며, 무책임한(irresponsible) 검토자 1명은 전체 검토자의 commitment를 18.7% 감소시킨다(altruism fatigue).
  3. 권위 편향과 후광효과(Halo Effects): 저자 신원이 알려진 논문에 대해서는 더 높은 평가가 주어지며, 전체 논문의 10%에서만 저자 신원이 공개되어도 최종 결정이 27.7% 변경된다.
  4. 편향 증폭(Groupthink & Echo Chamber): 편향된 검토자들이 서로 부정적 의견을 강화하여 평점이 0.17 감소하고, 이것이 중립적 검토자에게까지 영향을 미쳐 0.25의 추가 평점 감소를 초래한다.
  5. 정박 편향(Anchoring Bias): 리베탈의 영향이 다른 요인들보다 덜 중요하며, 이는 검토자들이 초기 인상에 크게 의존하기 때문이다.

How

Figure 3

책임감 없는 검토자와 악의적 검토자의 수에 따른 초기 및 최종 평점의 분포 변화

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 LLM 에이전트를 활용한 피어 리뷰 시뮬레이션이라는 혁신적 접근으로 기존 분석의 한계를 극복하고, 검토자 편향, 사회적 영향, 권위 편향 등의 정량적 영향을 처음 규명하여 피어 리뷰 시스템 개선에 실질적 기초를 제공한다. 다만 합성 데이터 기반 분석의 타당성 검증과 다양한 학문 영역으로의 일반화가 향후 과제이다.

같이 보면 좋은 논문

기반 연구
LLM 작성 피어 리뷰 탐지 연구가 AgentReview의 리뷰 시뮬레이션 검증에 기여한다.
다른 접근
피어 리뷰 시뮬레이션에서 LLM 에이전트와 다중 턴 대화 접근법의 서로 다른 모델링 방식이다.
후속 연구
AI 컨퍼런스 피어 리뷰 위기에 대한 논의가 AgentReview의 사회학적 분석을 확장한다.
← 목록으로 돌아가기