Automl in the age of large language models: Current challenges, future opportunities and risks

저자: Alexander Tornede, Difan Deng, Theresa Eimer, Joseph Giovanelli, Aditya Mohan, Tim Ruhkopf, Sarah Segel, Daphne Theodorakopoulos, Tanja Tornede, Henning Wachsmuth, Marius Lindauer | 날짜: 2023 | DOI: arXiv:2306.08107


Essence

Figure 1

AutoML이 LLM 생명주기(사전학습, 미세조정, 추론)의 모든 단계에 적용될 수 있으며, 각 단계의 서로 다른 목표, 하이퍼파라미터, 설계 결정에 맞춰 조정되어야 함을 보여줌

본 논문은 AutoML(자동 기계학습)과 LLM(대규모 언어 모델)의 상생적(symbiotic) 통합을 제안하며, 양 분야가 서로를 어떻게 강화할 수 있는지를 포괄적으로 탐색한다. AutoML이 LLM 최적화에 가져오는 도전과제, LLM이 AutoML 개선에 제공하는 기회, 그리고 통합 과정에서 발생할 수 있는 위험을 체계적으로 분석한다.

Motivation

Achievement

Figure 1

LLM 생명주기 전체에 걸친 AutoML 적용의 도전과제와 최적화 대상

  1. AutoML for LLM의 주요 도전과제 규정:
    • 사전학습의 극도의 계산 비용으로 인한 제한된 학습 실행
    • 다단계 훈련 프로세스에서 joint optimization의 불가능성
    • Neural Architecture Search(NAS) 성숙도 부족
    • 단계별 다른 평가 지표의 노이즈와 편향 문제
    • 다양한 학습 패러다임 동시 고려의 어려움
  2. LLM for AutoML의 기회 제시:
    • 자연언어를 통한 Human-Machine Interaction (HMI) 개선
    • AutoML 시스템 설정의 자동화 및 설명 가능성 강화
    • Meta-learning을 통한 AutoML 컴포넌트 개선
    • 비정형 텍스트 데이터로부터의 AutoML 지식 추출
  3. 통합의 잠재적 위험 분류:
    • LLM hallucination으로 인한 catastrophic failures
    • AutoML 결과에 대한 과도한 신뢰
    • 평가 방법론 부족
    • 계산 자원 수요의 지수적 증가

How

Figure 1

각 LLM 생명주기 단계별 AutoML 적용 방식

AutoML for LLMs 접근법:

LLMs for AutoML 접근법:

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4.5/5 Overall: 4.5/5

총평: 본 논문은 AutoML과 LLM의 상생적 통합에 대한 최초의 포괄적 분석으로, 현실적인 도전과제 규정과 함께 양방향 기회를 체계적으로 제시함으로써 향후 연구 방향을 명확히 한다. 다만 개념적 수준의 제안이 많고 구체적 구현 사례가 부족한 점이 아쉬우며, 제시된 위험 요소에 대한 미티게이션 전략 개발이 후속 연구의 중요한 과제가 될 것으로 예상된다.

같이 보면 좋은 논문

기반 연구
AutoML 벤치마킹 방법론이 과학 코딩 능력 평가 프레임워크 설계에 기초를 제공한다
기반 연구
대형 언어모델 시대의 AutoML 도전과제가 AutoML 도구 벤치마킹의 이론적 배경을 제공한다.
후속 연구
자동 기계학습의 개념을 데이터 사이언스 에이전트의 포괄적 워크플로우 관리로 확장한다
응용 사례
AutoML과 LLM의 통합 개념을 화학 공간 탐색의 구체적인 최적화 문제에 적용한다
응용 사례
LLM 에이전트 설계 개념을 AutoML과 결합한 자동화 시스템에 적용한다
응용 사례
AutoML과 LLM 통합 개념을 화학 분자 최적화라는 구체적 문제에 적용한 사례이다
응용 사례
과학 코딩 벤치마크를 AutoML과 LLM 통합 시스템의 성능 평가에 적용할 수 있다
← 목록으로 돌아가기