저자: Shruti Singh, Nandan Sarkar, Arman Cohan | 날짜: 2024 | DOI: 10.18653/v1/2024.emnlp-main.1163
과학 논문에 대한 피어 리뷰 중 검토자-저자 토론에서 추출된 질의응답 쌍의 예시
본 논문은 과학 논문의 깊이 있는 이해를 요구하는 새로운 질의응답(QA) 데이터셋 SCIDQA를 소개한다. OpenReview 플랫폼의 피어 리뷰에서 수집한 2,937개의 QA 쌍으로 구성되어 있으며, 표, 그림, 다중 문서 추론을 포함한 복잡한 과학 텍스트 이해를 평가한다.
SCIDQA 데이터셋 구축 파이프라인: 피어 리뷰에서의 LLM 기반 QA 추출 및 인간 전문가 주석 처리
PaLM 모델을 사용한 질의응답 추출을 위한 프롬프트
삼인칭 서술로의 재작성이 필요한 질의응답 쌍의 사례
참고문헌 표준화: 특정 참고문헌 마크를 플레이스홀더로 대체하여 단순 참고문헌 추출 방지
총평: SCIDQA는 피어 리뷰라는 자연스러운 데이터 원천과 엄밀한 품질 관리를 통해 과학 논문의 깊이 있는 이해를 평가하는 의미 있는 데이터셋을 제공하나, 도메인 제한성과 규모의 소재 측면에서 개선 여지가 있다.