ShinkaEvolve: Towards Open-Ended And Sample-Efficient Program Evolution

저자: R. Lange, Yuki Imajuku, Edoardo Cetin | 날짜: 2025 | DOI: 10.48550/arXiv.2509.19349


Essence

Figure 1

ShinkaEvolve 프레임워크 개요: 평가된 프로그램의 아카이브 구축, 거절 샘플링을 통한 새로운 프로그램 생성, 적응형 선택

대규모 언어모델(LLM)을 진화 알고리즘의 변이 연산자로 활용하여 샘플 효율성을 획기적으로 개선한 프로그램 진화 프레임워크이다. 세 가지 핵심 알고리즘 혁신(부모 선택 전략, 코드 신규성 거절 샘플링, 적응형 LLM 앙상블)을 통해 기존 방법 대비 수십 배 적은 평가로 최첨단 솔루션을 발견한다.

Motivation

Achievement

Figure 5

원 패킹 작업에서 ShinkaEvolve는 AlphaEvolve를 150개 샘플로 능가

  1. 획기적인 샘플 효율성: 원 패킹 문제에서 단 150개 샘플로 새로운 최첨단 솔루션 발견 (기존 방법 대비 수십 배 개선)
  2. 다양한 도메인 검증:
    • 수학 최적화(원 패킹)
    • AIME 수학 추론 작업용 고성능 에이전트 설계
    • ALE-Bench 경쟁 프로그래밍 문제 개선
    • 혼합전문가(MoE) 로드 밸런싱 손실함수 발견
  3. 오픈소스 공개: Apache 2.0 라이센스 하에 전체 코드와 대화형 시각화 도구 공개로 민주화 추진

How

Figure 2

부모 샘플링 전략: 균일 샘플링(순수 탐색)에서 언덕오르기(순수 활용)까지 다양한 선택지 제공

1. 적응형 부모 및 영감 프로그램 샘플링

2. LLM 유도 프로그램 변이 및 신규성 평가

Figure 3

코드 신규성 거절 샘플링: 임베딩 유사도 계산 → 임계값 초과 시 LLM 재평가

3. 실행 및 세계 피드백

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5

총평: ShinkaEvolve는 LLM 기반 프로그램 진화에서 부모 선택, 신규성 검증, 적응형 앙상블의 세 가지 혁신을 통해 샘플 효율성을 획기적으로 개선한 실용적 프레임워크이다. 오픈소스 공개로 재현성과 확장성을 보장하며, 다양한 도메인 검증도 인상적이나, 초매개변수 분석과 대규모 문제 확장성 검증을 통해 더욱 강화될 수 있다.

같이 보면 좋은 논문

다른 접근
LLM을 진화 알고리즘에 활용하는 두 가지 다른 접근법으로 프로그램 진화와 일반 최적화 비교가 가능함
후속 연구
LLM 기반 진화 최적화의 추론 능력을 프로그램 진화에 특화하여 샘플 효율성을 대폭 개선한 연구임
응용 사례
화학 공간에서의 효율적 진화 탐색 방법론을 프로그램 공간으로 확장 적용한 사례로 볼 수 있음
← 목록으로 돌아가기