Semi-Supervised 2D Human Pose Estimation Driven by Position Inconsistency Pseudo Label Correction Module

저자: Linzhi Huang, Yulong Li, Hongbo Tian, Yue Yang, Xiangang Li, Weihong Deng, Jieping Ye | 날짜: 2023-03-08 | DOI: 미제공


Essence

Figure 2

그림 2: 위치 불일치(Position Inconsistency) 개념 설명. 신뢰도(confidence)가 낮아도 위치 일관성이 높은 고품질 의사 레이블이 존재함을 보여줌

반인체 포즈 추정을 위한 준지도학습(semi-supervised learning)에서 위치 불일치 기반 의사 레이블 수정 모듈(SSPCM)을 제안하여, 노이즈 의사 레이블을 효과적으로 제거하고 SOTA 성능을 달성한 연구이다.

Motivation

Achievement

Figure 1

그림 1: COCO 데이터셋에서 레이블된 인스턴스 수에 따른 성능 비교. 모든 설정에서 기존 SOTA 대비 우수한 성능

  1. 성능 향상: COCO 데이터셋에서
    • 1,000개 레이블: +2.3 mAP (46.9% → 49.2%)
    • 5,000개 레이블: +1.9 mAP (51.1% → 53.0%)
    • 10,000개 레이블: +1.1 mAP (56.6% → 57.7%)
  2. 신규 데이터셋: 실내 오버헤드 어안카메라(fisheye) 기반 WEPDTOF-Pose 데이터셋 공개
  3. 다중 벤치마크 검증: MPII, COCO, AI-Challenger에서 일관된 성능 우수성 입증

How

Figure 3

그림 3: SSPCM의 전체 훈련 파이프라인. 4단계 상호 학습(interactive training) 구조

핵심 방법론

1. 위치 불일치 의사 레이블 수정 모듈(PCM)

```

Position Inconsistency Score = min distance among N predictions

```

2. 반지도학습 Cut-Occlude (SSCO)

3. 상호 학습 구조

Originality

Limitation & Further Study

Evaluation

총평: 준지도학습 기반 반인체 포즈 추정에서 위치 기반 의사 레이블 수정을 통해 실질적 성능 개선을 달성한 실용적인 연구이다. 특히 이질적인 teacher-student 구조 지원과 어안카메라 데이터셋 공개는 실제 응용 가치를 높이지만, 하이퍼파라미터 설정의 일반화 가능성에 대한 심화 분석이 필요하다.

같이 보면 좋은 논문

기반 연구
대규모 언어 모델의 편향 제거 프레임워크가 인체 포즈 추정에서 노이즈 의사 레이블 처리의 방법론적 기반
다른 접근
준지도학습에서 노이즈 처리를 위해 위치 불일치와 인간 없는 융합이라는 서로 다른 접근법 비교
← 목록으로 돌아가기