저자: Huachuan Qiu, Zhenzhong Lan | 날짜: 2024 | DOI: 논문 링크 미제공
그림 1: 시뮬레이션 프레임워크의 전체 아키텍처. 좌측: 클라이언트 풀 구성, 중앙: 대화형 시뮬레이션을 통한 데이터 수집, 우측: 모델 훈련
본 논문은 두 개의 대규모 언어모델(LLM)을 상담사와 내담자 역할로 활용하여 심리 상담 대화를 자동으로 생성하는 프레임워크를 제안한다. 인간 주석의 비용과 개인정보 문제를 해결하면서도 고품질의 합성 상담 데이터를 대규모로 생성할 수 있다는 점이 핵심이다.
그림 2: 내담자 시뮬레이션을 위한 프롬프트. 사용자 프로필에 기반한 대화형 요구사항
그림 3: 상담사 시뮬레이션을 위한 프롬프트. 통합 치료 기법 기반 3단계 모델
그림 4: 내담자 시뮬레이션의 일관성
그림 5: 실제 상담 데이터(RealPsyDial)와 생성 데이터(SimPsyDial) 간의 주제 분포 비교
방법론의 주요 구성요소:
총평: 본 논문은 LLM 기반 역할 극화를 통한 심리 상담 대화 자동 생성이라는 창의적이고 실용적인 접근법을 제시하며, 포괄적인 평가 방법론으로 신뢰성을 입증한다. 특히 합성 데이터로 훈련한 모델이 실제 상담 데이터 모델을 초과하는 성능을 달성한 점은 주목할 만하다. 다만 단일 LLM(GPT-4) 사용, 중국어 데이터 기반, 개인정보 보호 및 윤리적 고려에 대한 깊이 있는 논의 부재가 아쉬우며, 향후 다양한 LLM과 문화권에서의 검증이 필요하다.