저자: Sikun Guo, Amir Hassan Shariatmadari, Guangzhi Xiong, Aidong Zhang | 날짜: 2024-12-15 | DOI: 10.1109/BigData62323.2024.10825618
Fig. 1: The song of humanity is a song of courage. The diagram depicts the continuum of scientific inquiry spanning from
본 논문은 과학 분야 대규모언어모델(Sci-LLM)의 발전을 데이터 중심으로 분석하는 종합 서베이로, 270개 이상의 사전학습/사후학습 데이터셋과 190개 이상의 벤치마크를 체계적으로 검토하여 과학 AI의 로드맵을 제시한다.
Fig. 3: Evolution of Sci-LLMs reveals four paradigm shifts from 2018 to 2025, including (1) the progression from transfe
Fig. 4: Six main scientific domains covered in this survey.
총평: 본 서베이는 과학 분야 AI의 발전을 데이터 관점에서 종합적으로 분석한 중요한 기여로, 과학 LLM 개발을 위한 이론적 프레임워크와 실무적 로드맵을 제시한다. 다만 정량적 성과 분석과 자율 에이전트 패러다임의 구체적 구현 사례가 보강될 필요가 있다.