저자: Guangzhi Xiong, Eric Xie, Corey Williams, Myles Kim, Amir Hassan Shariatmadari | 날짜: 2025 | DOI: 10.24963/ijcai.2025/873
TruthHypo 벤치마크의 개요: 데이터셋 구성, 작업 공식화, 진실성 평가
본 논문은 과학 가설 생성에서 대규모 언어모델(LLM)의 진실성을 평가하기 위한 TruthHypo 벤치마크와 환각(hallucination) 탐지를 위한 KnowHD 프레임워크를 제시한다. LLM이 그럴듯해 보이지만 과학적으로 부정확한 가설을 생성하는 문제를 체계적으로 연구하기 위한 포괄적 접근법을 제공한다.
KnowHD 환각 탐지 프레임워크 개요
groundedness 수준에 따른 평균 정확도. 가설이 groundedness 점수별로 그룹화됨
데이터셋 구성:
과제 공식화:
평가 지표:
KnowHD 프레임워크:
총평: 이 논문은 LLM 기반 과학 발견의 신뢰성 문제를 처음 체계적으로 다루며, TruthHypo와 KnowHD라는 실용적 도구를 제공함으로써 과학 혁신에 실질적으로 기여할 수 있는 중요한 작업이다. 다만 생의학 영역 국한과 자동 평가의 견고성 강화가 향후 과제이다.