저자: David Wadden, Kyle Lo, Lucy Lu Wang, Arman Cohan, Iz Beltagy, Hannaneh Hajishirzi | 날짜: 2021 | DOI: arXiv:2112.01640
Ibuprofen 청구가 COVID-19 증상을 악화시킨다는 주장이 의료 논문 초록으로 반박되는 예시. 빨간색 문장은 근거이지만 파란색 맥락 없이는 올바르게 해석될 수 없음
과학 청구 검증 시스템이 선택된 근거 문장만 사용하지 않고 전체 문서 맥락을 활용하며, 약한 감독(weak supervision)을 통해 문장 수준의 주석 없이도 학습할 수 있는 멀티태스크 모델을 제시한다.
c t s1 ₁ ... sn ₙ 토큰, 청구의 모든 토큰, 모든 토큰에 전역 주의(global attention) 할당ᵢ 토큰 위의 이진 분류(피드포워드 2층 + softmax) 토큰 위의 3-방향 분류(SUPPORTS/REFUTES/NEI)총평: MULTIVERS는 전체 문서 맥락을 활용하고 약한 감독으로 학습 가능한 실용적 설계를 통해 과학 청구 검증의 성능을 크게 향상시킨 견고한 연구이며, 특히 전문 분야의 저자원 시나리오에서의 기여가 눈에 띈다.