Autocap: Towards automatic cross-lingual alignment planning for zero-shot chain-of-thought

저자: Yongheng Zhang, Qiguang Chen, Min Li, Wanxiang Che, Libo Qin | 날짜: 2024 | DOI: 미제공


Essence

Figure 1

전통적 교차언어 자기일관성 프레임워크(a)와 제안 방법 AUTOCAP(b)의 비교. 기존 방법은 수동으로 언어와 가중치를 지정하지만, AUTOCAP은 자동으로 최적 언어와 가중치를 선택한다.

본 논문은 다국어 Chain-of-Thought(CoT) 추론에서 언어 선택과 가중치 할당을 자동화하는 AUTOCAP(Automatic Cross-lingual Alignment Planning) 프레임워크를 제안한다. 기존 방법들의 수동 언어 지정과 동일 가중치 할당의 한계를 극복하여 영점 교차언어(zero-shot cross-lingual) 추론을 개선한다.

Motivation

Achievement

Figure 2

AUTOCAP의 전체 워크플로우. 자동 언어 선택 프롬프팅(§3.1)과 자동 가중치 할당 프롬프팅(§3.2), 그리고 자동 교차언어 프롬프팅 일관성(§3.3)으로 구성

  1. 최첨단 성능 달성: MGSM 벤치마크에서 평균 78.6% 정확도로 이전 최고 방법(Cross-ToT, 약 84% 특정 언어)을 능가하는 종합 성능 달성 (표 1)
  2. 수동 노력 제거: 수동으로 언어를 선택한 기존 방법들(CLSP 75.5%)과 비교하여 자동화된 AUTOCAP(78.6%)이 더 우수한 성능 달성으로 인적 개입 불필요성 입증
  3. 일반화 능력 강화: 다양한 언어 조합과 벤치마크에서 강한 일반화 능력 시연

How

Figure 3

단일 라운드 AUTOCAP의 정확도 분석

자동 언어 선택 프롬프팅(ALSP, §3.1):

자동 가중치 할당 프롬프팅(AWAP, §3.2):

교차언어 프롬프팅 일관성(§3.3):

Originality

Limitation & Further Study

Evaluation

총평: AUTOCAP은 교차언어 CoT에서 수동 언어 지정의 부담을 완벽히 제거하고 동적 가중치 할당을 통해 실질적 성능 향상을 이루어낸 실용적이고 효과적인 방법이다. 다만 프롬프팅 기반의 근본적 한계와 계산 효율성에 대한 분석 보완이 필요하다.

← 목록으로 돌아가기