저자: Adithya Kulkarni, Fatimah Alotaibi, Xinyue Zeng, Longfeng Wu, Tong Zeng, Barry Menglong Yao, Minqian Liu, Shuaicheng Zhang, Lifu Huang, Dawei Zhou | 날짜: 2025-05-06 | DOI: 10.48550/arXiv.2505.04651
과학적 가설 생성 및 검증 파이프라인: LLM, 통계 모델, 온톨로지를 통합하는 데이터 입력에서 반복적 검증 및 실제 배포까지의 단계를 보여줌
본 논문은 대규모 언어모델(LLM)을 활용한 과학적 가설 생성 및 검증의 체계적 종합 분석을 제시하며, 부호화 프레임워크부터 현대적 LLM 파이프라인까지 진화 과정을 추적하고 생물의학, 재료과학, 환경과학 등 다양한 도메인에서의 적용을 통합적으로 조망한다.
설문 구조의 흐름도: 가설 생성 방법론, 검증 기법, 도메인별 응용, 향후 방향을 안내
AI 기반 가설 생성의 모듈식 파이프라인: 다중모드 입력(텍스트, 구조화된 데이터)에서 가설 후보 생성까지의 흐름
가설 생성 방법론:
검증 방법론:
총평: 본 논문은 LLM 기반 과학적 가설 생성·검증의 현재 상태를 포괄적으로 정리한 중요한 설문이지만, 참신성 측정, 검증 비용-효과 분석, 윤리 구현의 구체화 측면에서 학문적 깊이를 보강할 필요가 있다. 실무 관점에서는 도메인별 성숙도 격차 완화와 인간-루프 시스템의 인지적 설계 원칙이 향후 연구의 중요한 과제이다.