Towards LLM-based Fact Verification on News Claims with a Hierarchical Step-by-Step Prompting Method

저자: Xuan Zhang, Wei Gao | 날짜: 2023 | DOI: N/A


Essence

대규모 언어모델(LLM)의 인컨텍스트 학습(ICL) 능력을 뉴스 클레임 검증에 활용하되, 계층적 단계별 프롬프팅(HiSS) 방법을 통해 클레임을 세부 클레임으로 분해하고 검색 엔진 기반의 증거 수집을 통해 사실 확인의 정확도와 설명 가능성을 높인 연구이다.

Motivation

Achievement

Figure 1

그림 1: Vanilla CoT 프롬프팅 기반 클레임 검증의 예시. 생성된 CoT가 "nukes"에 관한 필수 사고 누락과 증거 없는 사실 환각으로 인해 잘못된 판단에 도달한다.

  1. LLM의 인컨텍스트 학습 능력 입증: 단 4-shot 시연 예제만으로도 LLM이 대부분의 지도학습 방법을 능가할 수 있음을 확인하였으며, 이는 LLM이 허위정보 대응의 유망한 도구임을 시사한다.
  2. 최첨단 성능 달성: RAWFC와 LIAR 두 가지 공개 미정보 데이터셋에서 HiSS 프롬프팅이 기존의 완전 지도학습 방식을 능가하며, 매크로 평균 F1에서 평균 4.95% 향상을 달성하고 소수-샷 뉴스 클레임 검증에서 새로운 최첨단 성과를 수립했다.
  3. 향상된 설명 가능성: 기존 방법 대비 더 세분화되고 따라가기 쉬운 설명을 자동 평가와 인간 평가를 통해 입증했다.

How

Figure 2

그림 2: 제안된 HiSS 모델의 개요. 원본 인간 입력은 빨간색 배경으로 표시된다.

Hierarchical Step-by-Step (HiSS) 프롬프팅의 두 가지 주요 프로세스:

  1. 클레임 분해(Claim Decomposition)
    • LLM에 복잡한 클레임을 검증하기 더 쉬운 세부 클레임들로 분할하도록 지시
    • 명시적 및 암시적 검증 대상점(check-worthy points)을 철저히 생성하도록 유도
    • 예: "Donald Trump has said he loves war, 'including with nukes'"를 2개의 세부 클레임으로 분해
  2. 세부 클레임 검증(Subclaim Verification)
    • 각 세부 클레임에 대해 LLM이 단계적으로 일련의 질문을 생성하고 답변
    • 각 질문마다 외부 지식(검색 엔진)의 필요성을 명시적으로 판단하도록 지시
    • 신뢰도 평가 메커니즘을 통해 답변의 신뢰성 검증
    • 최종적으로 각 세부 클레임의 사실성을 판단하고 전체 클레임의 최종 라벨 결정

핵심 설계 원칙:

Originality

Limitation & Further Study

Evaluation

총평: 본 논문은 LLM 기반의 뉴스 클레임 검증에서 실무 지향적 성과를 보였으며, 계층적 분해와 검색 기반 증거 통합을 통해 LLM의 추론 능력을 실효적으로 향상시킨 의의 있는 연구이다. 다만 다양한 도메인과 언어로의 확장성 검증과 비용 효율성 개선이 향후 과제로 남아있다.

같이 보면 좋은 논문

다른 접근
복잡한 사실 확인에서 프로그램 가이드와 계층적 프롬프팅의 다른 추론 방법이다.
다른 접근
과학 뉴스와 일반 뉴스 클레임에서 LLM 기반 사실 검증의 다른 적용 분야이다.
다른 접근
과학 뉴스와 일반 뉴스 클레임 검증 모두 LLM 기반 사실 확인 기법을 사용한다.
후속 연구
프로그램 가이드 추론이 계층적 단계별 프롬프팅의 체계적 접근을 확장한다.
후속 연구
지식 그래프 기반 사실 검증이 뉴스 클레임 검증에서 계층적 접근법으로 발전한 형태다.
응용 사례
논리적 오류 탐지가 계층적 사실 검증에서 추론 과정 검증에 활용된다.
반론/비판
NLP 사실 확인의 비현실성 문제가 LLM 기반 검증 방법의 한계를 지적한다.
← 목록으로 돌아가기