저자: Y. Q. Wang, David Stevens, Pranay Shah, Wenwen Jiang, Miao Liu, Xu Chen, Robert Kuo, Na Li, Boying Gong, Daniel J. Lee, Jiabo Hu, Ning Zhang, Bob Kamma | 날짜: 2024 | DOI: 미제공
MILO 프레임워크: 데이터 주석 시스템에 AI/ML 모델을 통합하는 구조
본 논문은 전문 인간 주석자와 대규모 언어모델(LLM)의 협력을 통해 멀티모달 AI 데이터 주석 프로세스를 가속화하는 Model-in-the-Loop (MILO) 프레임워크를 제시한다. LLM을 사전 주석, 실시간 보조, 검증자로 활용하여 주석 시간 단축 및 품질 향상을 달성했다.
미세조정된 Llama 모델의 ROC 곡선 및 AUC 메트릭
사전 주석 LLM 보조 기능의 유무에 따른 작업당 처리 시간 차이(초)
사전 주석 LLM 보조 기능이 포함된 코멘트 분류 주석 UI의 예시
시각적 질의응답(VQA) 주석을 위한 실시간 LLM 보조 기능 포함/미포함 UI 비교
MILO 프레임워크의 3가지 핵심 역할:
시스템 구성:
총평: 본 논문은 대규모 AI 개발에서 실제적 가치가 큰 인간-LLM 협력 주석 프레임워크를 제시하며, 실제 프로덕션 환경에서의 검증을 통해 산업적 기여도가 높다. 다만 모델 편향 전파, 비용-편익 분석, 다양한 맥락에서의 일반화 가능성에 대한 보완이 필요하다.