Can Large Language Models Understand You Better? An MBTI Personality Detection Dataset Aligned with Population Traits

저자: Bohan Li, Jiannan Guan, Longxu Dou, Yunlong Feng 외 | 날짜: 2024 | DOI: arXiv:2412.12510


Essence

Figure 1

MBTIBENCH의 초점: 기존 MBTI 성격 탐지 데이터셋의 데이터 품질 문제와 소프트 라벨 부재 해결

본 논문은 Myers-Briggs Type Indicator (MBTI) 성격 탐지의 과도한 낙관성을 개선하기 위해, 심리학 전문가의 지도 하에 심리 전문가가 직접 주석을 단 첫 번째 소프트 라벨 MBTI 데이터셋 MBTIBENCH를 구축했다. 이는 자기보고식 라벨의 부정확성(29.58% 오류)과 극단적 성격만 표현하는 하드 라벨의 한계를 해결한다.

Motivation

Achievement

Figure 2

MBTI의 4가지 차원 정의: 외향성/내향성(E/I), 감각/직관(S/N), 사고/감정(T/F), 판단/인식(J/P)

  1. 데이터 품질 개선: 라벨 누수(직접 성격 누수, 성격 특성 누수, 교차 이론 특성 누수)와 쓸모없는 잡음(정보 부족, 깨진 텍스트, 링크/미디어) 제거로 기존 데이터셋의 29.58% 오류 해결
  2. 소프트 라벨 도입: [0, 1] 범위의 연속 표현으로 극성 경향 표현 (예: 외향성 40% = 내향성 60%), 비극단적 성격 특성을 가진 사람이 더 많음을 확인
  3. LLM 편향 분석: 6개 대규모 언어모델(LLM)과 4가지 프롬프팅 방법 평가로 극단화된 예측(polarized predictions)과 편향을 주요 연구 방향으로 제시

How

Figure 3

MBTIBENCH 구축 워크플로우: 데이터 필터링 → 주석 학습 → 형식적 주석 → 소프트 라벨 추정

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 MBTI 성격 탐지 연구의 데이터 품질 문제와 심리학적 현실성 간극을 체계적으로 해결한 의미 있는 기여다. 특히 심리학 전문가와의 협업을 통한 고품질 재주석과 소프트 라벨 도입은 향후 성격 탐지 및 LLM의 심리 이해도 평가에 중요한 벤치마크를 제공할 것으로 기대된다.

같이 보면 좋은 논문

다른 접근
MBTI 성격 탐지와 멀티모달 사르카즘 탐지라는 서로 다른 크로스모달 언어 분석 과제
다른 접근
멀티모달 사르카즘 탐지와 MBTI 성격 탐지라는 서로 다른 도메인의 크로스모달 언어 탐지
다른 접근
AI 생성 텍스트 탐지와 AI 기반 성격 탐지라는 서로 다른 AI 탐지 응용 분야
다른 접근
LLM의 편향 진단을 과학 분야 불문율 발견과 개인 성격 탐지라는 다른 도메인에 적용한 사례
응용 사례
LLM의 성격 탐지 능력을 과학 사회의 암묵적 편향 발견에 적용한 확장 연구
← 목록으로 돌아가기