저자: Shrinidhi Kumbhar, Venkatesh Mishra, Kevin Coutinho, Divij Handa, Ashif Iquebal, Chitta Baral (Arizona State University) | 날짜: 2025 | DOI: 10.48550/arXiv.2501.13299
본 연구는 대규모 언어모델(LLM)을 활용하여 소재 발견 및 설계를 위한 실행 가능한 가설을 자동 생성하는 ACCELMAT 프레임워크를 제안한다. 특히 반복적 피드백 기반 다중 에이전트 구조와 과학적 평가 메트릭을 통해 소재 과학자의 의사결정 과정을 모방하는 접근법을 제시한다.
그림 1: 반복적 가설 생성 및 평가 파이프라인의 개요. 가설 생성기(GPT-4o)가 20개 가설을 제안하고, 3명의 비평가가 검토한 후 합의에 도달할 때까지 정제 과정을 반복한다.
그림 2: Closeness 메트릭 점수 비교 분석
4단계 에이전트 구조:
반복 정제 프로세스:
총평: 본 연구는 LLM 기반 소재 발견 가설 생성 분야에서 도구-자유 접근, 다중 에이전트 비평 시스템, 데이터 유출 차단 벤치마크를 통해 의미 있는 기여를 제시한다. 특히 MATDESIGN 벤치마크는 실세계 소재 설계 문제를 반영한 평가 자산으로서 가치가 높다. 다만 생성된 가설의 실험실 검증 데이터 부재, 제한된 데이터셋 규모, 평가 메트릭의 객관화 부족 등이 완전한 실용화에 장애물로 작용한다. 향후 실험적 검증 루프 통합과 더 큰 규모의 다중 분야 벤치마크 확장이 이루어진다면, 소재과학의 AI 기반 가속화에 상당한 영향을 미칠 수 있을 것으로 기대된다.