저자: Ambrose Robinson, William Thorne, Ben Wu, Abdullah Pandor, Munira Essat, Mark Stevenson, Xingyi Song (The University of Sheffield) | 날짜: 2023 | DOI: arXiv:2308.06610
의료 체계적 문헌고찰(Systematic Review) 프로세스에서 Bio-SIEVE가 지원하는 제목 및 초록 스크리닝 단계
본 논문은 의료 체계적 문헌고찰의 가장 비용 집약적인 단계인 초록 스크리닝을 자동화하기 위해 지시어 미세조정(instruction tuning)을 통해 대규모언어모델(LLM)을 특화시킨 Bio-SIEVE를 제시한다. 이 모델은 ChatGPT를 능가하는 성능을 보이면서도 의료 영역 간 우수한 일반화 능력을 갖춘다.
학습 데이터셋의 포함/배제 분류에 따른 주제 분포
지시어 미세조정에 사용된 Cochrane 샘플의 예시
총평: Bio-SIEVE는 체계적 문헌고찰 자동화에 특화된 LLM을 제시함으로써 고가의 의료 리뷰 프로세스 개선에 유의미한 기여를 한다. 재현 가능한 공개 모델 공급과 배제 이유 생성이라는 새로운 과제 도입은 이 연구의 강점이나, 실제 임상 환경에서의 검증과 다중작업 학습 성능 개선이 향후 필수 과제이다.