Scientific discovery in the age of artificial intelligence

저자: Hanchen Wang, Tianfan Fu, Yuanqi Du, Wenhao Gao, Kexin Huang, Ziming Liu, Payal Chandak, Shengchao Liu, Peter Van Katwyk, Andreea Deac, Anima Anandkumar, Karianne Bergen, Carla P. Gomes, Shirley Ho, Pushmeet Kohli, Joan Lasenby, Jure Leskovec, Tie-Yan Liu, Arjun Manrai, Debora Marks | 날짜: 2023 | DOI: 10.1038/s41586-023-06221-2


Essence

Figure 1

과학적 발견의 다단계 프로세스에서 AI의 역할: 가설 형성, 실험 설계, 데이터 수집 및 분석 단계 전반에 걸친 AI 통합

본 리뷰 논문은 자기지도학습(self-supervised learning), 기하 심층학습(geometric deep learning), 생성형 AI 등 최근 10년간의 주요 AI 기술을 통해 과학적 발견이 어떻게 변모하고 있는지 종합적으로 조망한다. AI는 대규모 데이터셋 통합, 가설 탐색, 실험 설계 자동화 등을 통해 전통적 과학방법론만으로는 불가능한 새로운 과학적 통찰을 제공할 수 있다.

Motivation

Achievement

Figure 1

AI4Science의 다층적 응용 영역: 입자 충돌에서의 희귀사건 선별부터 단백질 구조 예측, 화학 합성 경로 계획, 기상 예측까지 다양한 과학 분야에서의 AI 활용

  1. AI의 다단계 과학 프로세스 통합: 가설 형성에서 실험 설계, 데이터 수집·분석·해석에 이르기까지 과학적 발견의 전 단계에서 AI가 인간의 역량을 증강(augment)하고 가속화(accelerate)할 수 있음을 입증
  2. 주요 기술 혁신의 체계적 분석:
    • 자기지도학습: 라벨이 없는 대규모 데이터로부터 전이 가능한 표현 학습
    • 기하 심층학습: 물리 법칙, 분자 기하학 등 과학적 구조를 모델에 인코딩
    • 생성형 AI: 소분자 약물, 단백질 등 새로운 설계 자동 생성
  3. 구체적 성공사례: 50년 묵은 단백질 폴딩 문제 해결, 백만 개 입자 분자 시뮬레이션, 비지도 언어 모델을 통한 주기율표와 미래 물질 발견 예측 등

How

Figure 2

과학 데이터의 의미 있는 표현 학습: (a) 기하 심층학습이 분자 구조와 같은 과학적 구조 정보를 어떻게 활용하는지

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 AI와 과학의 융합이라는 시대적 화두를 Nature라는 최고 권위의 플랫폼에서 다학제적 전문가 30여 명이 체계적으로 조망한 획기적 리뷰이다. 기술적 혁신과 함께 현실적 한계와 미해결 과제를 균형있게 제시함으로써 AI4Science 생태계의 건전한 발전을 위한 나침반 역할을 한다.

같이 보면 좋은 논문

기반 연구
AI4Science의 핵심 이론적 기반인 대칭성과 등변성을 과학적 발견의 전반적 변화와 연결한다
기반 연구
AI 시대의 과학 발견에 대한 근본적 논의가 AI 과학 통합 필요성 주장의 이론적 배경을 제공한다.
다른 접근
과학적 발견의 가속화와 데이터 신뢰성 위협이라는 AI4Science의 기회와 위험을 대비한다
후속 연구
AI4Science의 이론적 기반을 과학적 발견의 전반적 변화상으로 확장한 포괄적 조망을 제공한다
응용 사례
AI 기반 과학적 발견의 전반적 변화를 동료심사 과정의 구체적 개선에 적용한다
응용 사례
AI 기반 과학적 발견의 전반적 변화를 동료심사 질 관리라는 구체적 영역에 적용한다
반론/비판
과학적 발견의 가속화와 데이터 무결성 위협이라는 AI의 양면성을 대조적으로 보여준다
← 목록으로 돌아가기