Hallucinations can improve large language models in drug discovery

저자: Shuzhou Yuan, Zhan Qu, Ashish Yashwanth Kangen, Michael Färber | 날짜: 2025 | DOI: N/A


Essence

Figure 1

HHEM-2.1-Open 모델을 사용한 사실적 일관성 점수. 대부분의 LLM이 MolT5 기준 설명과 낮은 일관성을 보여 광범위한 환각을 나타냄

일반적으로 문제로 간주되는 대규모 언어모델(LLM)의 환각(hallucinations)이 오히려 약물 발견의 분자 특성 예측 과제에서 모델의 성능을 향상시킬 수 있다는 역설적인 발견을 제시한다. 구조적 오기술(structural misdescription)과 같은 특정 유형의 환각이 모델의 일반화 능력을 증대시키는 암묵적 반사실(implicit counterfactual)로 작동함을 보여준다.

Motivation

Achievement

Figure 2

HIV 데이터셋 샘플을 이용한 방법 설명. SMILES로부터 환각된 분자 설명을 생성한 후 이진 분류 과제의 프롬프트에 포함

  1. 성능 향상: Falcon3-Mamba-7B가 환각 포함 시 모든 기준선을 초과하며 PubChem 기준선보다 ROC-AUC 8.22% 개선. Llama-3.1-8B는 SMILES 기준선 대비 15.8%, MolT5 기준선 대비 11.2% 향상. GPT-4o에서 생성된 환각이 모델들 간 가장 일관된 성과 제공.
  2. 환각 분석: 18,000개 이상의 유익한 환각을 식별 및 분류. 구조적 오기술이 가장 영향력 있는 유형으로 도출되어, 분자 구조에 대한 환각된 진술이 모델 신뢰도를 증가시킬 수 있음을 시사. 기타 유형: 기능적 환각(functional hallucination), 유추적 환각(analogical hallucination), 일반적 수사(generic fluff).

How

Figure 3

7개 LLM 전반의 ROC-AUC 평균 향상도

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: 환각의 역설적 유익성을 실증적으로 제시하는 창의적 연구로, 약물 발견 도메인에 새로운 관점을 제공한다. 다만 메커니즘 이해와 실제 적용 가능성 검증이 보완되면 임팩트가 더욱 강화될 것이다.

같이 보면 좋은 논문

기반 연구
환각의 일반화 능력 향상 효과가 물리 제약 기반 약동학 예측에서 모델 견고성을 높이는 이론적 근거를 제공한다.
기반 연구
물리 제약 기반 다중 작업 학습이 환각의 일반화 능력을 구조화된 지식으로 활용하는 이론적 근거를 제공한다.
후속 연구
환각이 가져오는 암묵적 반사실 추론 능력이 다중 에이전트 협력에서 더욱 정교한 약물 발견 추론으로 발전될 수 있다.
반론/비판
약물 발견에서 환각의 긍정적 활용과 대조학습의 음성 샘플 확보라는 정반대의 데이터 품질 접근법이다.
반론/비판
약물 재창출에서 음성 샘플 부족 문제 해결과 환각을 긍정적으로 활용하는 상반된 데이터 처리 철학이다.
반론/비판
환각이 문제라는 관점과 약물 발견에서 환각이 도움이 될 수 있다는 상반된 시각을 비교할 수 있다.
← 목록으로 돌아가기