저자: Jhih-Yi Hsieh, Aditi Raghunathan, Nihar B. Shah | 날짜: 2024 | DOI: N/A
ML/AI 학술대회의 자동화된 심사위원 배정 시스템에서 텍스트 매칭(text-matching) 알고리즘이 담합(collusion) 공격에 취약함을 입증한다. SPECTER 임베딩 기반의 유사도 계산이 공모하는 저자와 심사위원에 의해 조작될 수 있으며, 이를 통해 심사위원의 순위를 101위에서 상위 5위로 올릴 수 있음을 보였다.
담합하는 저자와 심사위원의 협력 공격 메커니즘 illustration
프로필 선별(adversarial curation)에 따른 성공률 편차
과거 데이터로 미래 공격 성공률 예측 가능성
총평: 이 논문은 자동화된 학술 심사 시스템의 텍스트 매칭 기반 심사위원 배정이 예상외로 담합에 취약함을 처음 입증하며, NeurIPS 실제 데이터로 92% 공격 성공률을 달성했다. 이미 OpenReview 등 주요 플랫폼에 보안 개선이 적용되어 실질적 영향력을 발휘하고 있는 중요한 보안 연구이다.