Using artificial intelligence for systematic review: the example of elicit

저자: Nathan Bernard, Yoshimasa Sagawa Jr, Nathalie Bier, Thomas Lihoreau, Lionel Pazart, Thomas Tannou | 날짜: 2025-03-18 | DOI: 10.1186/s12874-025-02528-y


Essence

Elicit는 체계적 문헌고찰(systematic review) 과정에서 보조 도구로 사용될 수 있으나, 아직까지는 전통적 방법을 완전히 대체하지 못하며 신중한 사용과 방법론적 엄격성 유지가 필수적이다.

Motivation

Achievement

![Figure 1 설명: Tannou et al. 연구(좌측), Elicit(우측) 및 체계적 문헌고찰 단계별 비교(a, b, c)]

  1. 반복성 부족: 동일한 검색 조건에서 세 번의 시행 결과 각각 246개, 169개, 172개의 상이한 결과 도출. 합치면 총 241개 논문으로 일관성 결여를 보임.
  2. 제한적 신뢰성: 최종 포함된 17개 논문 중 Elicit가 식별한 것은 3개(17.6%)에 불과. 기존 우산형 고찰에서만 식별된 논문이 14개. Elicit이 독점적으로 식별한 논문 3개 존재.
  3. 정확도의 이중성: Elicit이 발견한 3개 추가 논문은 포함기준에 부합하나, 최종 우산형 고찰의 결론을 변경할 정도의 실질적 정보를 제공하지 못함. 그러나 Elicit의 6개 논문만으로도 기존 17개 논문과 동일한 결론 도출 가능.

How

Originality

Limitation & Further Study

Evaluation

총평: 체계적 문헌고찰에서 AI 도구 Elicit의 실제 성능을 실증적으로 평가한 의미 있는 연구이지만, 방법론적 견고성과 일반화 가능성이 제한적이며, "신중한 보조 도구로 사용하되 완전 대체 불가"라는 예상된 결론을 확인한 수준이다. AI 도구 개발의 빠른 진전을 고려할 때 정기적인 재평가와 더욱 체계적인 벤치마킹 연구가 필요하다.

같이 보면 좋은 논문

기반 연구
연구를 위한 최적 AI 도구 선택에 대한 종합 가이드가 Elicit과 같은 특정 도구의 적절한 활용을 위한 전체적 맥락을 제공한다.
다른 접근
과학적 검색을 위한 검색증강 생성 에이전트가 Elicit과는 다른 AI 기반 문헌 연구 도구 접근법을 제시한다.
후속 연구
문헌 리뷰를 위한 LLM 활용 조사가 Elicit의 체계적 문헌고찰 적용을 더 넓은 AI 기반 문헌 연구로 확장한다.
응용 사례
체계적 문헌고찰에서 Elicit 활용 사례가 본 논문의 AI 도구 선택 가이드를 구체적 연구 방법론에 적용한 실제 사례이다.
← 목록으로 돌아가기