저자: Qiao Jin, Bhuwan Dhingra, Zhengping Liu, William Cohen, Xinghua Lu | 날짜: 2019 | DOI: 미제공
PubMedQA 데이터셋 인스턴스 예시: 질문은 원문의 제목이며, 맥락은 결론을 제외한 구조화된 초록이고, 장답변은 결론, 최종 답변은 yes/no/maybe
생의학 분야의 연구 논문 초록을 이용하여 yes/no/maybe로 답변하는 질문응답 데이터셋을 제안한다. 1,000개의 전문가 주석 데이터, 61,200개의 미표지 데이터, 211,300개의 자동생성 데이터로 구성되며, 정량적 추론이 필요한 최초의 생의학 QA 데이터셋이다.
PubMedQA 데이터셋 구조: PQA-Labeled(1k), PQA-Unlabeled(61.2k), PQA-Artificial(211.3k)의 세 가지 부분집합으로 구성
PubMedQA 데이터셋의 MeSH 주제 분포: 인간 연구, 여성, 남성, 중년 등의 용어가 높은 빈도로 나타남
데이터 수집 방법론:
모델 아키텍처:
한계:
후속 연구 방향:
총평: PubMedQA는 생의학 텍스트 기반 추론이 필수적인 첫 대규모 QA 데이터셋으로, PubMed의 자연적 구조를 창의적으로 활용한 점과 삼층 구조의 체계적 설계가 돋보인다. 다만 자동생성 부분집합의 품질 한계와 인간-모델 성능 격차 분석의 부족이 보완되어야 할 점이다.