Causal learning for socially responsible ai

저자: Lu Cheng, Ahmadreza Mosallanezhad, Paras Sheth, Huan Liu | 날짜: 2021 | DOI: N/A


Essence

Figure 1

Figure 1: CL for SRAI의 분류체계. 파란 사각형은 SRAI에 일반적으로 사용되는 4가지 인과학습 도구를 나타냄

본 논문은 AI의 사회적 책임성(Social Responsibility)을 강화하기 위해 인과학습(Causal Learning, CL)의 7가지 도구를 체계적으로 분석하고, 편향 완화, 공정성, 투명성, 일반화 가능성 등 주요 SRAI 과제에 적용하는 방법론을 제시한다.

Motivation

Achievement

  1. 7가지 인과학습 도구의 체계적 분류:
    • 인과가정(Causal Assumptions)은 AI 시스템을 더 투명하고 검증 가능하게 만든다
    • Do-calculus는 혼재변수(confounding)를 제거하여 허위 상관관계를 배제한다
    • 반사실 분석(Counterfactual Analysis)은 "만약 X였다면" 질문의 답변을 가능하게 한다
    • 중재분석(Mediation Analysis)은 인과효과를 직접효과와 간접효과로 분해한다
    • 적응성(Adaptability)은 환경 변화에서 AI의 성능 저하를 해결한다
  2. SRAI 4대 과제에 대한 구체적 응용 방법론 제시:
    • 편향 완화: 성향점수(Propensity Score), 반사실 데이터 증강(CDA), 인과그래프 활용
    • 공정성: 인과 모델링을 통한 민감속성의 인과효과 추정
    • 투명성: 반사실 설명(Counterfactual Explanation)과 개입 기반 방법
    • 불변성/일반화: Invariant Risk Minimization(IRM), 인과 발견 알고리즘(causal discovery)

How

Figure 2

Figure 2: 인기도 편향을 완화하기 위한 인과그래프

편향 완화 (Bias Mitigation)

공정성 (Fairness)

Figure 3

Figure 3: 불변성을 위한 반사실 데이터 증강

투명성 (Transparency)

일반화 가능성/불변성 (Generalizability/Invariance)

Originality

Limitation & Further Study

한계점

  1. 인과가정의 현실성 문제:
    • 실무에서 정확한 인과그래프를 수립하기 어렵고, 부정확한 인과가정은 오히려 편향을 증대시킬 수 있다
    • 성향점수 방법도 올바른 성향점수 형태를 미리 알아야 한다는 가정이 현실성 떨어짐
  2. 계산 복잡도 및 확장성:
    • 대규모 데이터에서 인과 발견 알고리즘의 계산 비용이 매우 높음
    • 고차원 데이터에서 인과관계 식별이 어려움
  3. 도메인 지식 의존성:
    • 반사실 데이터 증강(CDA)은 전문가 주석자의 개입이 필수적이며, 주석 과정에서 새로운 편향이 도입될 위험
    • 인과그래프 구성이 영역 전문 지식에 크게 의존
  4. 윤리 및 실험적 제약:
    • 인과효과를 검증하기 위한 무작위 대조 실험(RCT)이 윤리적·재정적 이유로 불가능한 경우 많음
    • 성향점수 기반 방법은 위치 랜덤화 시 사용자 경험이 심각하게 저하될 수 있음

후속 연구 방향

  1. 약한 인과가정 조건 개발: 도메인 지식이 제한적인 상황에서도 작동 가능한 경량 인과가정 프레임워크 개발
  2. 인과-통계 하이브리드 방법론: 인과구조를 완전히 알지 못할 때, 통계적 방법과 부분적 인과지식을 결합하는 방법론 강화
  3. 적응형 인과 발견: 데이터 수집 과정과 인과 발견을 동시에 수행하는 온라인 학습 알고리즘 개발
  4. 설명 가능성과 공정성의 트레이드오프: 투명한 반사실 설명과 모델 성능(utility) 간의 균형을 이루는 방법론
  5. 크로스도메인 인과 전이: 한 분야에서 학습한 인과구조를 다른 분야에 전이하는 메커니즘 연구
  6. 동적 환경에서의 불변성: 시간에 따라 인과구조가 변하는 환경(concept drift)에서의 불변성 보장 방법

Evaluation

← 목록으로 돌아가기