저자: Qiguang Chen, Libo Qin, Jinhao Liu, Yue Liao, Jiaqi Wang, Jingxuan Zhou, Wanxiang Che | 날짜: 2025 | DOI: arXiv:2505.13307
그림 1: 제안된 개념 개요 - (a) 추론 경계(RB), (b) 계측 가능한 시나리오에서 상한을 정량화하는 결합법칙, (c) 상수 가정 및 (d) 계측 불가능한 경계를 위한 경계 분할 메커니즘, (e) 최적화를 위한 RB 분류
본 논문은 추론 경계 프레임워크++(RBF++)를 제안하여 대형 언어 모델(LLM)의 체인-오브-씽크(CoT) 추론 능력의 한계를 정량화하고 최적화하는 방법론을 제시한다. 계측 가능한 능력과 계측 불가능한 능력(멀티모달 지각 등) 모두에 대해 체계적으로 추론 경계를 분석하고 최적화 전략을 도출한다.
그림 2: 추론 경계의 존재 검증 - BigGSM에서 수행된 평가 결과
그림 3: 텍스트 모달에서 다양한 작업에 대한 RB의 결합법칙 검증
$$B^{Acc=K_1}(t|m) = \sup_d \{d | Acc(t|d,m) \leq K_1\}$$
목표 정확도 임계값(K₁)을 초과하는 최대 난이도 수준으로 정의
$$B(t_1, t_2, \ldots, t_n) \approx \frac{1}{\sum_{i=1}^{n} \frac{1}{B(t_i)}}$$
가중 조화 평균을 사용하여 독립적 능력의 결합 경계 추정
계측 가능한 상위 j개 부분 경계는 개별적으로 평가하고, j+1번째부터는 상수 Z로 대체
통합 경계 B(p,o,v)를 계획(p), 연산(o), 도메인 지식(v)의 독립적 경계로 분해 가능
그림 4: BigGSM의 텍스트 모달 시나리오에서 다양한 추론 경계의 특성 분석
총평: RBF++는 CoT 추론의 경계를 정량화하는 새로운 프레임워크로, 계측 가능한 영역과 불가능한 영역을 모두 다루려는 야심찬 시도이다. 광범위한 실증 검증과 실용적 최적화 방법(MARP++)을 제시한 점이 강점이나, 이론적 기초(특히 상수 가정)의 엄밀성과 보편성에 대해 추가적 논의가 필요하다.