저자: Haiming Wang, Huajian Xin, Zhengying Liu, Wenda Li, Yinya Huang, Jianqiao Lu, Zhicheng Yang, Jing Tang, Jian Yin, Zhenguo Li, Xiaodan Liang | 날짜: 2024 | DOI: arXiv:2405.14414
그림 1: 단계적 증명과 재귀적 증명의 비교. (a) 단계적 접근은 증명의 계층 구조를 무시하고 증명 단계들의 시퀀스로만 취급. (b) 재귀적 증명은 검증 가능한 증명 스케치를 여러 레벨로 분해하여 단계별로 중간 명제 증명을 미루는 방식으로 진행.
신경망 기반 자동 정리 증명(automated theorem proving)에서 기존의 단계적(step-by-step) 탐색 방식의 한계를 극복하기 위해, 본 논문은 POETRY(PrOvE Theorems RecursivelY)를 제안한다. 이는 Isabelle 정리 증명기에서 재귀적이고 계층적 접근을 통해 증명을 단계적으로 구성하는 방법으로, 중간 명제들의 증명을 sorry 플레이스홀더로 미루고 더 깊은 레벨에서 해결하는 방식이다.
sorry 타틱을 활용하여 중간 명제의 증명을 임시로 건너뛰고, 각 레벨에서 검증 가능한 증명 스케치를 먼저 탐색한 후, 다음 레벨에서 미뤄진 명제들을 재귀적으로 증명하는 방식.
그림 3: POETRY와 GPT-f 기준선 간 증명 길이 비교. y축은 로그 스케일로 표시.
그림 2: 재귀적 BFS(Best-First Search) 탐색의 상세 예시. 증명 트리의 각 노드는 증명 상태(proof state)를 나타냄.
proof level 정보를 활용하여 계층 구조를 추출. Algorithm 1의 EXTRACTPROOFSKETCH 함수가 증명 단계들을 재귀적으로 처리하며, 깊이가 증가하는 지점에서 sorry로 중간 증명을 대체.sorry를 해결할 때까지 다음 레벨의 명제들에 대해 동일한 재귀적 탐색 수행.sorry 타틱의 창의적 활용: Isabelle의 기본 기능인 sorry를 신경 증명의 핵심 메커니즘으로 재해석. 이를 통해 거짓 중간 명제의 경우 자동으로 다시 탐색하는 자정(self-correction) 메커니즘 구현.proof level과 sorry 타틱에 강하게 의존. Lean, Coq, HOL 등 다른 형식 환경으로의 확장은 추가 공학적 노력이 필요하며, 저자들도 이를 향후 과제로 명시.총평: POETRY는 형식 증명의 자연스러운 계층 구조를 처음 체계적으로 활용하여 근시안적 단계적 탐색의 한계를 극복한 창의적 방법이다. 특히 증명 길이 확장과 SOTA 성능 달성은 주목할 만하나, 거짓 명제 사전 검증 부재, 계산 비용 분석 미흡, Isabelle 의존성 등의 한계가 있으며, 다른 형식 환경으로의 일반성 입증이 필요하다.