저자: Jeffrey Hu, Rongzhi Dong, Ying Feng, Ming Hu, Jianjun Hu | 날짜: 2026-03-24 | DOI: 10.48550/arXiv.2603.12567
그림 1: 기초 모델이 능동 학습의 서로게이트 모델링 딜레마를 해결함. (a) 기존 모델들은 예측 능력과 불확실성 추정 간의 트레이드오프 직면 (b) 기초 모델은 메타 학습된 사전 정보를 통해 표현력 높은 예측과 보정된 불확실성 결합
소재 발견을 위한 능동 학습(Active Learning, AL)에서 기존 가우스 프로세스(GP)와 랜덤 포레스트(RF) 서로게이트 모델의 한계를 극복하기 위해, 트랜스포머 기반의 기초 모델(Foundation Model, FM)인 TabPFN을 서로게이트로 도입하는 문맥 내 능동 학습(In-Context Active Learning, ICAL) 프레임워크를 제안한다. TabPFN은 메타 학습을 통해 소량의 실험 데이터에서도 표현력 높은 예측과 보정된 불확실성을 동시에 제공한다.
그림 3: Cu 경도(hardness) 데이터셋에서 ICAL의 성능. (a-b) TabPFN vs GP 비교
그림 4: (a)(c) Cu 전기전도도 및 (b)(d) 벌크 금속 유리(Glass_DS3) 데이터셋에서의 비교
그림 2: 소재 발견을 위한 풀 기반 능동 학습 파이프라인. EI(Expected Improvement)는 다른 획득 함수로 대체 가능
그림 5: 원소 농도 특성을 사용한 LTC_conc 데이터셋에서의 ICAL 성능 비교
총평: 본 논문은 기초 모델의 메타학습 능력을 소재 발견 능동 학습의 핵심 문제(표현력 vs. 불확실성 트레이드오프)에 창의적으로 적용하였으며, 광범위한 벤치마크로 우월성을 입증했다. 다만 실제 실험 환경 검증과 고차원 특성 공간 확장이 완성되면 임팩트가 더욱 강화될 것으로 예상된다.