저자: Arash Lagzian, Srinivas Anumasa, Dianbo Liu | 소속: National University of Singapore | 날짜: 2025 | DOI: arXiv:2502.12700
다중 관점 임베딩을 통한 LLM 생성 콘텐츠의 다양성과 신규성 향상 개요
본 논문은 추론 시점(inference-time)에 텍스트와 이미지 기반 다중 관점(multi-view) 임베딩을 활용하여 대규모 언어모델(LLM)이 생성하는 콘텐츠의 다양성과 신규성을 개선하는 아키텍처 무관(model-agnostic) 방법을 제안한다.
다양성, 신규성, 정확성 평가 결과 (전체 답변 vs 정확한 답변)
텍스트 다중 관점 임베딩 프로세스
이미지 기반 관점 생성 및 설명 개선 프로세스
텍스트 관점 임베딩 (Text View Embedding)
이미지 관점 임베딩 (Image View Embedding)
다양성 측정 (Diversity)
신규성 측정 (Novelty)
정확성 측정 (Correctness)
총평: 본 논문은 LLM의 다양성과 신규성 문제에 실질적인 솔루션을 제시하며 909k 규모의 광범위한 실험으로 효과를 입증했으나, 기저 개념의 신규성이 제한적이고 계산 비용 및 다국어 확장성에 대한 고려가 충분하지 않다. 실무 적용 가치는 높으나 학술적 혁신성은 중간 수준.