저자: Shujian Zhang, Chengyue Gong, Lemeng Wu, Xingchao Liu, Mingyuan Zhou | 날짜: 2023 | DOI: 미제공
그림 1: AutoML-GPT의 개요. 데이터 처리부터 모델 아키텍처, 하이퍼파라미터 튜닝, 예측 훈련 로그 생성까지의 전체 파이프라인을 보여줌
본 논문은 GPT와 같은 대규모 언어모델(LLM)을 자동 머신러닝(AutoML) 시스템의 컨트롤러로 활용하여, 데이터 처리부터 모델 아키텍처 설계, 하이퍼파라미터 튜닝까지 전체 머신러닝 파이프라인을 자동화하는 AutoML-GPT 시스템을 제안한다. 모델 카드(Model Card)와 데이터 카드(Data Card)를 활용한 구조화된 프롬프트를 통해 LLM이 다양한 AI 작업을 자동으로 최적화할 수 있게 한다.
그림 4: 미지의 데이터셋에 대한 AutoML-GPT의 작동 방식. 텍스트 인코더를 통한 데이터셋 유사도 계산 및 예측 훈련 로그 생성
그림 2: 데이터 카드는 데이터 이름, 입력 데이터 타입, 레이블 공간, 평가 지표로 구성
그림 3: 모델 카드는 모델 이름, 모델 구조, 모델 설명, 아키텍처 하이퍼파라미터로 구성
AutoML-GPT의 작동 방식:
한계점:
후속 연구 방향:
총평: AutoML-GPT는 LLM의 강력한 언어 이해 능력을 머신러닝 자동화에 창의적으로 적용한 흥미로운 시도이며, 다양한 도메인에서의 응용 가능성이 높다. 그러나 예측 훈련 로그의 정확성 검증 부재와 실제 구현 세부사항의 부족으로 기술적 완성도 측면에서 개선이 필요하다.