저자: Mubashara Akhtar, Oana Cocarascu, Elena Simperl | 날짜: 2023 | DOI: 10.48550/ARXIV.2301.11843
ChartFC 데이터셋의 예: 청구(claim)가 증거 차트로 지지되는 경우
본 논문은 차트 이미지를 증거로 하여 텍스트 청구의 진위를 판정하는 새로운 자동 팩트-체킹(AFC) 과제를 제안하고, 이를 위한 첫 번째 모델인 ChartBERT를 소개한다. 텍스트, 구조, 시각 정보를 결합하여 차트 기반 주장 검증의 복잡한 추론 문제를 해결한다.
ChartBERT 아키텍처: 읽기(Reading), 시퀀스 생성, 인코딩 세 가지 구성 요소
ChartBERT 입력 표현: 추출된 텍스트와 구조 임베딩(x, y 좌표, 라벨 임베딩)
1단계 - 텍스트 및 구조 정보 추출
2단계 - 텍스트 시퀀스 생성
3단계 - 인코딩 및 분류
데이터셋 구축
한계점
후속 연구 방향
총평: 차트 기반 팩트-체킹이라는 중요하고 미충족된 문제를 신규 제안하며 체계적 벤치마킹을 제공하는 의미 있는 연구이나, 63.8%의 정확도와 제한된 차트 유형으로 인해 실용적 영향은 아직 제한적이다. 해결해야 할 도전 과제가 많이 남아있는 초기 단계의 기초 연구로 평가된다.