저자: Raymond Li, Loubna Ben Allal, Yangtian Zi 외 70명 이상 (BigCode 커뮤니티) | 날짜: 2023년 12월 | DOI: N/A
BigCode 커뮤니티가 개발한 StarCoder는 155억 파라미터 규모의 오픈 소스 코드 생성 대형언어모델(Code LLM)로, 책임감 있는 AI 개발을 위해 저작권, 개인정보, 투명성을 고려하여 설계되었으며, 기존 모든 오픈 코드 LLM을 능가하는 성능을 달성했다.
PII 주석 데이터셋의 프로그래밍 언어 분포
총평: StarCoder는 고성능 오픈 코드 LLM의 필요성을 충족시키고 책임감 있는 AI 개발의 실질적 모델을 제시했으나, 법적·윤리적 쟁점의 완전한 해결보다는 투명성과 감시 도구를 제공하는 수준으로, 산업 및 연구 커뮤니티의 기여를 크게 높였으나 잠재적 법적 위험은 여전히 존재한다.