Paper2Web: Let's Make Your Paper Alive!

저자: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen | 날짜: 2025-10-17 | DOI: N/A


Essence

Figure 1

학술 논문을 다양한 형식(슬라이드, 포스터, 비디오, 웹사이트, AI 어시스턴트)으로 변환하는 통합 플랫폼의 일부로서 Paper2Web 위치

학술 논문을 정적인 PDF 형식에서 벗어나 대화형(interactive) 멀티미디어 웹사이트로 변환하는 작업을 새롭게 정의하고, 이를 위한 벤치마크 데이터셋과 평가 프레임워크를 제시한다. 제안된 PWAgent는 반복적 개선을 통해 기존 방법들을 큰 폭으로 능가한다.

Motivation

Achievement

Figure 2

현재 학술 웹페이지 생성의 문제점: (a) arXiv HTML 버전의 이미지 오버플로우, (b) alphaXiv 생성 웹페이지의 이미지-텍스트 불균형

Figure 3

파레토 프론트 비교: PWAgent가 적정 수준의 비용으로 최고 품질 달성

  1. 데이터셋 구축: ICML, NeurIPS, WWW, ICLR 등 주요 AI 컨퍼런스(2020-2025)에서 10,716개의 논문-웹페이지 쌍을 수집하고 특성 분석(정적 42.4%, 멀티미디어 38.9%, 대화형 9.8%)
  2. 평가 프레임워크:
    • 규칙기반 메트릭(연결성, 완전성)
    • 인간검증 MLLM-as-a-Judge(대화형성, 미학성, 정보성)
    • PaperQuiz(웹페이지 스크린샷에서의 지식 전이 평가)
  3. 성능 개선:
    • 연결성/완전성에서 약 12% 평균 개선
    • arXiv HTML 대비 28% 향상
    • MLLM-as-a-Judge에서 18% 평균 개선
    • 가장 강력한 end-to-end 베이스라인 대비 3배 성능 달성

How

Figure 4

데이터 수집 파이프라인: 논문 메타데이터 수집 → 프로젝트 웹사이트 검색 → LLM/인간 판별을 통한 필터링

PWAgent 파이프라인:

Originality

Limitation & Further Study

Evaluation

총평: Paper2Web은 학술 논문의 웹기반 공유라는 중요하면서도 미해결된 문제를 체계적으로 정의하고, 포괄적인 벤치마크 데이터셋과 다차원 평가 프레임워크를 제공한다는 점에서 상당한 가치가 있다. PWAgent의 성능 개선도 인상적이나, 기술적 독창성 측면에서는 기존 방법들의 조합 수준이므로 전체적으로는 높은 수준의 실질적 기여를 하는 작업으로 평가된다.

같이 보면 좋은 논문

기반 연구
Overleaf 학술 작성 지원 코파일럿이 Paper2Web의 대화형 학술 콘텐츠 변환 기반을 제공한다.
다른 접근
학술 콘텐츠 변환에서 논문-웹사이트 변환과 논문-포스터 생성이라는 서로 다른 시각적 변환 방식을 제시한다.
후속 연구
인간-AI 협업 스토리 편집기가 Paper2Web의 대화형 멀티미디어 콘텐츠 생성으로 확장되었다.
후속 연구
논문 코드 생성이 웹 기반 논문 시연으로 확장되어 연구 결과의 상호작용적 표현을 가능하게 합니다.
← 목록으로 돌아가기