저자: Bohan Li, Jiannan Guan, Longxu Dou, Yunlong Feng 외 | 날짜: 2024 | DOI: arXiv:2412.12510
MBTIBENCH의 초점: 기존 MBTI 성격 탐지 데이터셋의 데이터 품질 문제와 소프트 라벨 부재 해결
본 논문은 Myers-Briggs Type Indicator (MBTI) 성격 탐지의 과도한 낙관성을 개선하기 위해, 심리학 전문가의 지도 하에 심리 전문가가 직접 주석을 단 첫 번째 소프트 라벨 MBTI 데이터셋 MBTIBENCH를 구축했다. 이는 자기보고식 라벨의 부정확성(29.58% 오류)과 극단적 성격만 표현하는 하드 라벨의 한계를 해결한다.
MBTI의 4가지 차원 정의: 외향성/내향성(E/I), 감각/직관(S/N), 사고/감정(T/F), 판단/인식(J/P)
MBTIBENCH 구축 워크플로우: 데이터 필터링 → 주석 학습 → 형식적 주석 → 소프트 라벨 추정
총평: 본 논문은 MBTI 성격 탐지 연구의 데이터 품질 문제와 심리학적 현실성 간극을 체계적으로 해결한 의미 있는 기여다. 특히 심리학 전문가와의 협업을 통한 고품질 재주석과 소프트 라벨 도입은 향후 성격 탐지 및 LLM의 심리 이해도 평가에 중요한 벤치마크를 제공할 것으로 기대된다.