저자: Jian Wu, Jiayu Zhang, Dongyuan Li, Linyi Yang, Aoxiao Zhong, Renhe Jiang, Qingsong Wen, Yue Zhang | 날짜: 2025 | URL: https://arxiv.org/abs/2502.18209
Figure 2: The League framework for leaderboard automatic generation. In Stage 1, we automatically
League는 arXiv와 학술지에서 자동으로 논문을 수집하여 LLM 기반으로 실험 결과를 추출하고 통합함으로써 동적으로 리더보드를 자동 생성하는 프레임워크이다.
Figure 3: The example leaderboard generated by League. Comparing with the Leaderboard of
Figure 2: The League framework for leaderboard automatic generation. In Stage 1, we automatically
총평: League는 급증하는 학술 논문에 대응하여 자동으로 최신 리더보드를 생성하는 혁신적 프레임워크이며, 실험 설정을 포함한 공정한 비교라는 새로운 관점을 제시한다. 인간 성능에 근접한 결과와 5-10배의 효율성 향상으로 실질적 가치를 입증하나, LLM 오류 처리 및 다분야 일반화 개선이 필요하다.