저자: Yi Cai, Gerhard Wunder | 날짜: 2024 | DOI: arXiv:2308.09381
기준선 f(-3) ≈ 0이 주어질 때, GEEX의 평활화된 버전이 실제 기여도를 더 잘 근사함
본 논문은 GEEX (Gradient-Estimation-based EXplanation)를 제안하여 블랙박스 설정에서도 화이트박스 수준의 그래디언트 유사 설명을 생성할 수 있음을 보인다. 쿼리 레벨 접근만으로 정밀한 특성 귀속(feature attribution)을 제공하면서도 완전성(Completeness), 민감도(Sensitivity) 등 기본 공리를 엄밀히 만족한다.
GEEX의 개요: 샘플링된 노이즈 ε와 경로상 위치 α로부터 쿼리 z 결정
InceptionV3에서 GEEX는 n이 증가함에 따라 IG와 수렴하는 AOPC 점수 달성*
간단한 사례: 그래디언트 포화로 인해 추정된 그래디언트 η가 0으로 수렴하여 민감도 공리 위반
핵심 방법론:
총평: GEEX는 그래디언트 기반 설명의 정밀성과 블랙박스 방법의 유연성을 결합한 실용적이고 이론적으로 견고한 접근법이다. 특히 엄밀한 공리 기반 분석으로 설명의 신뢰성을 보증하는 점이 주목할 만하나, 계산 비용과 기준선 선택 문제에 대한 추가 논의가 보강되면 더욱 완성도 높은 연구가 될 것이다.