Advancing multimodal medical capabilities of gemini

저자: Lin Yang, Shawn Xu, Andrew Sellergren, Timo Kohlberger, Yuchen Zhou, Sofia Ira Ktena, Atilla P. Kiraly, Faruk Ahmed, Farhad Hormozdiari, Tiam Jaroensri, E.-W. Wang, Ellery Wulczyn, F Guimaraes Silvio Jamil, Theo Guidroz, Chuck Lau, Siyuan Qiao, Yun Liu, Akshay Goel, Kendall Park, Arnav Agharwal | 날짜: 2024 | DOI: arXiv:2405.03162v1


Essence

Figure 1

Med-Gemini 모델군의 구성과 다양한 의료 작업에서의 성능 개요

Gemini의 멀티모달 역량을 의료 영역에 특화시킨 Med-Gemini 모델 패밀리를 개발하여, 흉부 X선(CXR) 보고서 생성, 3D CT 해석, 의료 영상 분류, 유전체 위험도 예측 등 다양한 임상 작업에서 기존 최고 성능을 초과하거나 경쟁력 있는 결과를 달성했다.

Motivation

Achievement

Figure 3

의료 전문가에 의한 CXR 보고서 생성 평가 결과

  1. CXR 보고서 생성: 정상 사례에서 57-96%, 비정상 사례에서 43-65%의 AI 생성 보고서가 원래 방사선과 의사의 보고서와 "동등 이상"으로 평가. 두 개의 독립 데이터셋에서 기존 최고 성능을 절대값 1%~12% 상회
  2. 3D CT 해석: 멀티모달 모델 기반 3D CT 부피(volume) 보고서 생성 최초 시연. 53%의 AI 보고서가 임상적으로 수용 가능하나, 전문가 품질 달성을 위해 추가 연구 필요
  3. CXR 시각 질문 응답(VQA): 이전 최고 성능 초과. CXR 분류 및 방사선학 VQA에서 20개 작업 중 17개에서 기존 최고 성능(SoTA) 또는 기준점 초과
  4. 병리학/안과학/피부과학 분류: 20개 작업 중 18개에서 기준점 초과, 작업별 특화 모델 성능에 접근
  5. 다유전자 위험도 예측(Polygenic Risk Prediction): 표준 선형 다유전자 위험도 점수(PRS) 기반 접근법 초과. 학습하지 않은 유전적으로 상관된 질병으로 일반화

How

Figure 2

조직병리학 영상 분류 성능 분석

Originality

Limitation & Further Study

Evaluation

총평: Med-Gemini는 대규모 멀티모달 기초 모델의 의료 특화에 있어 종합적이고 체계적인 접근을 보여주며, 특히 CXR 보고서 생성과 다양한 의료 영상 분류 작업에서 임상적으로 의미 있는 성과를 달성했다. 3D CT 해석과 유전체 위험도 예측 통합은 의료 AI의 범위를 확장하는 중요한 시도이나, 임상 배포 검증 부재와 3D 성능 격차는 실제 임상 영향 평가의 한계로 남는다.

같이 보면 좋은 논문

기반 연구
바이오메디컬 언어모델의 기초 연구를 멀티모달 의료 능력으로 확장한 발전된 형태의 연구임
기반 연구
바이오메디컬 언어모델이 Gemini의 멀티모달 의료 능력 개발에 필요한 의료 도메인 지식 기반을 제공함
기반 연구
Gemini의 의료 멀티모달 능력 개발이 과학 전반의 멀티모달 추론 평가 벤치마크 설계에 기술적 기반을 제공함
다른 접근
의료 멀티모달 AI에서 Gemini 기반 Med-Gemini와 GPT-4V의 서로 다른 접근법과 성능을 비교 분석할 수 있음
다른 접근
의료 영상 진단에서 GPT-4V와 Med-Gemini의 서로 다른 멀티모달 접근법과 임상 적용 가능성을 비교 분석할 수 있음
다른 접근
Gemini 기반 의료 멀티모달 능력과 SCIVERSE의 과학 문제 해결 평가 방법론을 비교 분석할 수 있음
후속 연구
의료 문헌 스크리닝의 언어 처리 능력을 멀티모달 의료 진단으로 확장한 더 포괄적인 의료 AI 시스템임
후속 연구
의료 언어 에이전트의 위험 예측 능력을 Gemini의 멀티모달 의료 능력과 결합하여 더 포괄적인 임상 지원 시스템 구축이 가능함
← 목록으로 돌아가기