M2F: Automated Formalization of Mathematical Literature at Scale

저자: Zichen Wang, Wanli Ma, Zhenyu Ming, Gong Zhang, Kun Yuan, Zaiwen Wen | 날짜: 2026-02-19 | DOI: N/A


Essence

Figure 1: M2F 프로젝트 규모 자동 형식화 파이프라인

본 논문은 수학 교과서와 논문을 프로젝트 규모의 Lean 형식화로 자동 변환하는 최초의 에이전트 프레임워크 M2F를 제시한다. 검증자 피드백을 루프에 유지하며 세 주 안에 153,853줄의 형식화된 Lean 라이브러리를 생성하여 텍스트북 규모 형식화의 실용성을 입증했다.

Motivation

Achievement

Figure 2: FATE-H에서의 PSR 비교
  1. 프로젝트 규모 형식화의 실현:
    • 실수 해석(Real Analysis) 312페이지, 볼록 해석(Convex Analysis) 140페이지, 논문 27페이지 총 479페이지를 3주 내에 241개 파일, 4,116개 선언, 153,853줄의 완전 컴파일 가능한 Lean 라이브러리로 변환
    • 전체 프로젝트 end-to-end 엘라보레이션(elaboration) 성공 달성
    • 이는 전문가가 수개월~수년 걸릴 작업을 자동화
  2. 강력한 증명 성능:
    • FATE-H 벤치마크에서 96% 증명 성공률(PSR) 달성 (기준선 Seed-Prover 1.5: 80%, +16포인트 향상)
    • 매칭된 문장 조건에서 Stage 2의 100% PSR 달성 (컴파일된 프로젝트 내)

How

Figure 4: 워크플로우 능력 선언(Verifier-in-the-loop 파이프라인)

Stage 1: 문장 컴파일(Statement Compilation)

Stage 2: 증명 수리(Proof Repair)

VeriRefine 원시 (공통)

```

Edit Propose → VerifyFile → {

if (err(Δ) < err(Δ_prev)) or (compiled && goal reduced):

Commit

else:

Revert

}

```

Originality

Limitation & Further Study

한계

후속 연구

Evaluation

Novelty: 5/5 Technical Soundness: 4.5/5 Significance: 5/5 Clarity: 4/5 Overall: 4.5/5

총평: M2F는 자동 형식화 분야의 패러다임 전환을 시도하는 논문이다. 기존의 고립된 증명 탐색에서 벗어나 프로젝트 규모의 구조 문제(의존성, 임포트, 타입 안정성)를 검증자 피드백 루프로 해결하는 VeriRefine 원시는 창의적이며, 153K 줄의 완전 컴파일 가능한 Lean 코드 생성은 학술 기준을 크게 상회한다. 다만 고정 환경 의존성, 순환 의존성 미처리, 비정형 원문 견건성 등이 한계로 남아 있어, 완전한 산업 배포까지는 추가 작업이 필요하다.

같이 보면 좋은 논문

후속 연구
M2F의 수학 문헌 자동 형식화 연구가 필기 수학식 LaTeX 변환의 상위 응용 분야를 보여준다
← 목록으로 돌아가기