Productivity assessment of neural code completion

저자: Albert Ziegler, Eirini Kalliamvakou, X. Alice Li, Andrew Rice, Devon Rifkin, Shawn Simister, Ganesh Sittampalam, Edward Aftandilian | 날짜: 6월 13, 2022 | DOI: 10.1145/3520312.3534864


Essence

Figure 1

GitHub Copilot의 코드 완성 단계별 흐름

신경망 기반 코드 완성 도구의 개발자 생산성 향상 효과를 측정하기 위해, GitHub Copilot 사용자 2,631명의 설문 응답과 실제 사용 데이터를 연계 분석하여 제안 수락률(acceptance rate)이 개발자의 생산성 인식을 가장 잘 예측하는 지표임을 입증한 실증 연구이다.

Motivation

Achievement

Figure 2

설문 응답자 인구통계(전문 프로그래머 상당수 포함)

  1. 수락률 우수성: 제안된 항목 중 수락된 항목의 비율(수락률, acceptance rate)이 수락된 코드의 양(accepted_char), 지속성(persistence) 등 더 세부적인 메트릭보다 개발자의 생산성 인식을 더 잘 예측함을 통계적으로 입증
  2. 다층적 분석: 개발자 인구(2,047명 매칭), 프로그래밍 언어, 시간대 등에 따른 수락률의 상당한 변동성을 확인하고, GitHub Copilot의 전체 수락률이 27%, 일일 평균 수락 건수(DCPU)가 31건임을 파악
  3. 방법론 기여: 오프라인-온라인 평가 간 간극을 해소하기 위해 실제 개발자를 생산성의 전문가 평가자로 활용하는 설문-텔레메트리 연계 방식을 확립

How

Figure 3

사용 메트릭 간 상관관계: 모든 차원이 생산성 지표와 유사하게 대응

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 5/5 Overall: 4/5

총평: 본 논문은 AI 보조 개발 도구의 실제 영향을 개발자 인식과 사용 데이터로 검증한 산업-학계 연계 연구로, 수락률이 생산성 지표로서의 타당성을 입증함으로써 신경망 기반 코드 완성 시스템의 평가 및 모니터링 방향을 제시하는 의미 있는 기여를 한다. 다만 상관 분석의 한계를 넘어 인과 메커니즘과 세부 특성을 규명하는 후속 연구가 필요하다.

← 목록으로 돌아가기