CLAM: Selective clarification for ambiguous questions with generative language models

저자: Lorenz Kuhn, Yarin Gal, Sebastian Farquhar | 날짜: 2023 | DOI: arXiv:2212.07769


Essence

Figure 1

Figure 1. (a) 일반적인 언어모델의 동작 (b) CLAM: 애매한 질문 감지 및 명확화 질문 생성

대규모 언어모델(LLM)이 애매한 사용자 질문에 대해 명확화를 요청하지 않고 부정확한 답변을 제공하는 문제를 해결하기 위해, CLAM 프레임워크를 제안한다. 이는 애매한 질문을 감지하고 명확화 질문을 생성한 후 사용자의 명확화 정보를 바탕으로 최종 답변을 제공하는 선택적 명확화(selective clarification) 접근법이다.

Motivation

Achievement

Figure 2

Figure 2. 선택적 명확화의 4단계 과정

  1. CLAM 프레임워크 제안: 애매한 질문을 감지하고 선택적으로 명확화를 요청하는 통합 프레임워크 개발. 기존 SotA 모델 대비 애매한 질문 포함 데이터셋에서 유의미한 정확도 향상 달성.
  2. 메타인지 개념 도입: 언어모델이 "생각에 대한 생각"을 명시적으로 수행하는 메타인지를 새로운 설계 패러다임으로 제시. Chain-of-thought 프롬팅보다 체계화된 접근법 제공.
  3. 자동 평가 프로토콜: 비용이 많이 드는 인간 평가를 대체하기 위해, 특권정보(privileged information)를 제공받은 언어모델이 사용자 역할을 수행하는 자동 평가 방식 개발. 다중턴 대화 평가의 확장성 문제 해결.
  4. Ambiguous TriviaQA 데이터셋: 200개의 애매한/명확한 질문 쌍으로 구성된 벤치마크 데이터셋 구축. 기존 ClariQ, CLAQUA 등의 한계를 보완.

How

Figure 3

Figure 3. 애매한 사용자 입력을 명확화하기 위한 프롬트 구조

CLAM 프레임워크 구현:

자동 평가 프로토콜:

Originality

Limitation & Further Study

Evaluation

총평: 애매한 질문에 대한 LLM의 선택적 명확화 요청이라는 실용적 문제를 메타인지 패러다임으로 창의적으로 해결하고, 자동 평가 프로토콜로 다중턴 대화 평가의 확장성을 높인 좋은 연구이다. 다만 기술적 독창성과 평가 규모에서 개선 여지가 있다.

같이 보면 좋은 논문

기반 연구
애매한 질문에 대한 명확화 요청이라는 동일한 핵심 문제를 다룹니다.
기반 연구
상호작용을 통한 모호성 해결 연구가 LLM의 능동적 질의 명확화 방법론의 이론적 기반을 제공한다.
다른 접근
일관성 유지를 위한 프롬프팅과 명확화를 통한 정확성 향상이라는 다른 전략을 비교할 수 있습니다.
다른 접근
질의응답에서 애매함 해결과 신뢰할 수 있는 증거 활용이라는 서로 다른 품질 향상 전략을 제시합니다.
다른 접근
건강 질의응답에서 신뢰할 수 있는 증거 활용과 애매함 명확화라는 서로 다른 품질 향상 전략입니다.
후속 연구
LLM의 자기 검증 능력을 명확화 질문 생성으로 확장한 접근법입니다.
← 목록으로 돌아가기