저자: Yongheng Zhang, Xu Liu, Ruoxi Zhou, Qiguang Chen, Hao Fei, Wenpeng Lü, Libo Qin | 날짜: 2025 | DOI: 10.48550/arXiv.2505.19108
그림 1: (a) 교차-언어 환각(cross-lingual hallucination) - "stand"를 "站在"로 오역, (b) 교차-모달 환각(cross-modal hallucination) - 존재하지 않는 "bridge" 생성, (c) 교차-언어 및 교차-모달 환각의 결합
본 논문은 대규모 언어 모델(LLM)이 교차-언어 및 교차-모달 상황에서 동시에 겪는 환각(hallucination) 문제를 평가하기 위한 새로운 벤치마크 CCHall(Cross-lingual and Cross-modal Hallucinations)을 제시한다. 기존 연구가 단일 시나리오(교차-언어 또는 교차-모달)에만 집중한 반면, 이 연구는 두 문제가 결합된 실제 상황을 평가하는 최초의 종합 벤치마크를 개발했다.
그림 2(a): 다양한 환각 유형에 대한 MLLM의 F1-점수 성능 분석, (b): 기존 벤치마크와 CCHall의 비교
그림 3: CCHall 구성 과정 - (a) 원본 다중모달 데이터셋 선택, (b) 교차-모달 환각 데이터 구성, (c) 교차-언어 환각 데이터 구성, (d) 결합된 벤치마크
총평: CCHall은 기존 연구의 명확한 갭을 식별하고 실제 응용에서 중요한 결합 환각 문제를 평가하는 최초의 벤치마크로, 높은 실용성과 학문적 가치를 제공한다. 다만 자동 환각 생성 방법론의 검증과 메커니즘 분석이 보강되면 더욱 강력한 자료가 될 수 있다.