Lego-prover: Neural theorem proving with growing libraries

저자: Huajian Xin, Haiming Wang, Chuanyang Zheng, Lin Li, Zhengying Liu, Qingxing Cao, Yinya Huang, Jing Xiong, Han Shi, Enze Xie, Jian Yin, Zhenguo Li, Xiaodan Liang, Heng Liao | 날짜: 2023 | DOI: N/A


Essence

Figure 1(a) and (b)

LEGO-Prover의 구조: (a) Plain prover와의 비교 - LEGO-Prover는 모듈식 증명 구성, (b) 프로버(Prover)와 에볼버(Evolver)로 이루어진 전체 프레임워크

대규모 언어모델(LLM)을 이용한 신경 정리 증명(Neural Theorem Proving)에서 검증된 보조정리(lemma)를 재사용 가능한 기술(skill)로 활용하는 성장 가능한 라이브러리를 도입함으로써, 모듈식 증명 구성을 통해 증명 능력을 대폭 향상시킨다. 이를 통해 miniF2F 벤치마크에서 최첨단 성능을 달성하고 22,532개의 검증된 기술을 자동 생성한다.

Motivation

Achievement

Figure 3

성장하는 기술 라이브러리의 효과: LEGO-Prover의 증명 성공률 변화

  1. 벤치마크 성능 향상: miniF2F-valid에서 48.0% → 57.0%, miniF2F-test에서 45.5% → 50.0%로 기존 최첨단 대비 평균 6.75% 절대 개선
  2. 대규모 기술 라이브러리 자동 구성: 증명 과정 중 20,532개 이상의 검증된 보조정리/정리(skill) 자동 생성 및 라이브러리 구축
  3. 기술 라이브러리의 검증된 효과: 기술 라이브러리 활용에 따른 성공률 47.1% → 50.4% 개선을 통해 새로 추가된 기술들의 실질적 유용성 입증
  4. 증명 간극 감소: 생성된 기술 라이브러리가 인간 증명과 형식 증명(formal proof) 간 격차를 완화하여 누락된 단계 추론 용이성 향상

How

Figure 2

LEGO-Prover의 작동 흐름: (a) 프로버의 3단계 증명 과정 (b) 스킬 라이브러리와의 상호작용

1. 프로버(Prover) 모듈:

2. 에볼버(Evolver) 모듈:

3. 기술 라이브러리(Skill Library):

4. 기술 활용 방식:

Originality

Limitation & Further Study

Evaluation

총평: LEGO-Prover는 신경 정리 증명에 성장 가능한 검증된 보조정리 라이브러리를 도입하는 창의적 접근으로 명확한 성능 향상을 달성하였으며, 생성된 대규모 기술 라이브러리의 실용적 가치를 입증했다. 다만 더 복잡한 수학 문제로의 확장성과 계산 비용 효율성에 대한 추가 검증이 필요하다.

같이 보면 좋은 논문

기반 연구
정리와 증명의 통합 합성이 성장 가능한 라이브러리 구축의 기초 방법론을 제공함
기반 연구
AIGS의 자동화된 반증 시스템이 Lego-prover의 검증된 보조정리 재사용 메커니즘을 활용할 수 있음
다른 접근
라이브러리 기반 모듈식 증명과 인터리브 사고-증명의 서로 다른 신경 정리 증명 접근법
후속 연구
성장 가능한 라이브러리에서 LLM 기반 고급 정리 증명으로 확장된 연구
응용 사례
검증된 보조정리 라이브러리가 AI 과학 시스템의 자동화된 반증 과정에 직접 활용될 수 있음
← 목록으로 돌아가기