A comprehensive survey on long context language modeling

저자: Jiaheng Liu, Dawei Zhu, Zhiqi Bai, Yancheng He, Huanxuan Liao, Haoran Que, Zekun Wang, Chenchen Zhang, Ge Zhang, Jiebin Zhang, Yuanxing Zhang, Zhuo Job Chen, Hangyu Guo, S. Li, Ziqiang Liu, Yong Shan, Yifan Song, Jiayi Tian, Wenhao Wu, Zongqing Zhou | 날짜: 2025 | URL: https://arxiv.org/abs/2503.17407


Essence

Figure 2

Figure 2. Taxonomy of Long Context Language Modeling.

장문맥 언어모델(LCLM) 구축, 훈련, 배포, 평가를 위한 포괄적 조사로, 데이터 전략부터 인프라, 평가 패러다임, 응용 분야까지 체계적으로 정리한 대규모 서베이 논문.

Motivation

Achievement

Figure 4

Figure 4. Taxonomy of Long Context Model Architectures.

How

Figure 3

Figure 3. Illustration of training pipeline of LCLMs.

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: 장문맥 언어모델의 전체 생명주기를 최초로 체계적으로 정리한 필수 참고 자료로, 데이터부터 배포까지 실무자에게 유용하며, 평가 신뢰성 문제 지적 등 비판적 통찰도 제공한다.

같이 보면 좋은 논문

기반 연구
검색 증강 언어모델 사전학습이 장문맥 처리 능력 개발의 기반 방법론을 제시한다.
기반 연구
장문맥 언어모델링 서베이가 대규모 테이블 처리를 위한 계층적 추론의 기반 이론을 제공한다.
기반 연구
장문맥 언어모델의 포괄적 조사가 LLM 계획 능력 평가의 기반 이론을 제공한다.
후속 연구
장문맥 작성에 영향을 미치는 요소 분석이 장문맥 언어모델링의 실제 응용 측면을 확장한다.
응용 사례
하이브리드 검색 증강 생성에서 최적 컨텍스트 길이 추정이 장문맥 모델링의 실용적 적용을 보여준다.
응용 사례
극도로 긴 입력에서 장문 기사 생성이 장문맥 언어모델링의 실제 적용 사례를 구체적으로 보여준다.
← 목록으로 돌아가기