저자: Jonas Belouadi, Anne Lauscher, Steffen Eger | 날짜: 2023 | DOI: 10.48550/arXiv.2310.00367
텍스트 설명으로부터 과학 논문용 벡터 그래픽을 자동으로 생성하기 위해 TikZ라는 추상 그래픽 언어를 중간 표현(intermediate representation)으로 활용하고, 대규모 TikZ 데이터셋(DaTikZ, 120k)을 구축하여 LLaMA와 CLIP 기반 하이브리드 모델(CLiMA)을 개발했다.
그림 1: CLiMA로 생성된 과학 벡터 그래픽 예시
그림 2: 자동 평가 결과 비교
데이터 수집 및 처리:
모델 아키텍처:
학습 전략:
평가 방법론:
한계점:
후속 연구 방향:
총평: 텍스트-벡터 그래픽 생성의 새로운 패러다임을 제시하는 우수한 연구로, 120k 규모의 TikZ 데이터셋과 공개 모델을 제공함으로써 학술 커뮤니티에 실질적 기여를 하고 있다. 다만 데이터 품질 검증 강화와 시각적 평가 방식 개선을 통해 추가 발전 가능성이 있다.