저자: Kayvan Kousha, Mike Thelwall | 날짜: 2026-03-16 | URL: https://arxiv.org/abs/2603.14919
ChatGPT는 연구 품질 평가 시 실제 연구 품질과 무관한 언어적 복잡성과 초록 길이에 과도하게 영향을 받으며, 이는 인간 전문가의 평가와 다른 편향된 패턴을 보여준다.
총평: 본 논문은 ChatGPT의 연구 평가에서 나타나는 체계적 편향을 경험적으로 입증하여 AI 기반 평가 시스템의 신뢰성 문제를 제기하며, 실무적으로 LLM 기반 연구 평가 도입 시 주의해야 할 점을 명확히 제시한다.