저자: Weimin Wu, Alexander C. Furnas, Eddie Yang, Gefei Liu, Akhil Pandey Akella, Xuefeng Song, Dashun Wang, Han Liu | 날짜: 2025-09-25 | DOI: 10.48550/arXiv.2509.21493
Figure 1: Overview of Sci2Pol-Taxonomy and Dataset Source. (a) Sci2Pol-Taxonomy defines a
과학 논문을 정책 문서로 변환하는 LLM 성능 평가를 위한 첫 번째 벤치마크(Sci2Pol-Bench)와 미세조정 데이터셋(Sci2Pol-Corpus)을 제시하며, 인간의 집필 과정을 반영한 5단계 분류체계를 기반으로 18개 과제를 설계했다.
Figure 2: Overview of the Sci2Pol-Corpus Curation Process. It consists of 639 high-quality pa-
Figure 2: Overview of the Sci2Pol-Corpus Curation Process. It consists of 639 high-quality pa-
총평: 본 논문은 과학-정책 간 격차 해소라는 실질적 문제에 대응하는 첫 전문 벤치마크와 데이터셋을 제시하며, 인간 중심의 분류체계와 LLM 기반 평가 메트릭을 통해 고품질 평가 체계를 구축했다는 점에서 높은 원창성과 실용적 가치를 가진다.