Lag: Llm agents for leaderboard auto generation on demanding

저자: Jian Wu, Jiayu Zhang, Dongyuan Li, Linyi Yang, Aoxiao Zhong, Renhe Jiang, Qingsong Wen, Yue Zhang | 날짜: 2025 | URL: https://arxiv.org/abs/2502.18209


Essence

Figure 2

Figure 2: The League framework for leaderboard automatic generation. In Stage 1, we automatically

League는 arXiv와 학술지에서 자동으로 논문을 수집하여 LLM 기반으로 실험 결과를 추출하고 통합함으로써 동적으로 리더보드를 자동 생성하는 프레임워크이다.

Motivation

Achievement

Figure 3

Figure 3: The example leaderboard generated by League. Comparing with the Leaderboard of

How

Figure 2

Figure 2: The League framework for leaderboard automatic generation. In Stage 1, we automatically

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: League는 급증하는 학술 논문에 대응하여 자동으로 최신 리더보드를 생성하는 혁신적 프레임워크이며, 실험 설정을 포함한 공정한 비교라는 새로운 관점을 제시한다. 인간 성능에 근접한 결과와 5-10배의 효율성 향상으로 실질적 가치를 입증하나, LLM 오류 처리 및 다분야 일반화 개선이 필요하다.

같이 보면 좋은 논문

후속 연구
학술 그래프 마이닝에서 정적 큐레이션을 동적 자동 생성 시스템으로 발전시킨다
응용 사례
인용 추천 벤치마크의 평가 지표를 리더보드 자동 생성에서 실험 결과 추출과 통합에 적용한다
← 목록으로 돌아가기