저자: Christopher Clark, Kenton Lee, Ming‐Wei Chang, Tom Kwiatkowski, Michael J. Collins, Kristina Toutanova | 날짜: 2019 | DOI: N/A
자연 발생적 예/아니오 질문에 대한 읽기 이해 데이터셋 BoolQ를 제시하며, BERT와 같은 최신 사전학습 모델도 도전적인 이 작업에서 인간 성능(90%)과 큰 격차(80.4%)를 보임을 입증한다.
BoolQ 데이터셋의 예시: 자연 발생적 예/아니오 질문, Wikipedia 문단, 정답 및 설명
총평: BoolQ는 자연 발생적 예/아니오 질문의 내재된 복잡성을 체계적으로 규명하고, BERT 이후 시대에도 NLI 전이학습의 지속적 가치를 증명하는 중요한 벤치마크 데이터셋이다. 다만 멀티-홉 추론과 도메인 다양성 측면에서는 확장 가능성을 남겨두고 있다.