저자: Anna Martin-Boyle, Aahan Tyagi, Marti A. Hearst, Dongyeop Kang | 날짜: 2024 | DOI: N/A
인용 그래프 비교: (상단) 인간이 작성한 관련 연구 섹션, (중단) ScholaCite를 통한 GPT 협력 버전, (하단) GPT 전적 생성 버전. 노드는 인용 문헌을, 간선은 같은 문장 내 인용의 동시 출현을 나타냄
본 논문은 학술 논문의 관련 연구(Related Work) 섹션 작성에서 GPT-4의 능력을 실증적으로 평가한다. 인용 그래프(citation graph) 분석을 통해 GPT는 거시적 인용 그룹화는 가능하나, 인간의 개입 없이 정교한 문헌 종합을 실패함을 보여준다.
ScholaCite 워크플로우: 원본 인간 저술 텍스트, ScholaCite 기반 GPT 협력 텍스트, GPT 단독 생성 텍스트의 생성 과정
총평: 본 논문은 급증하는 AI 기반 학술 저술 도구 사용 속에서 GPT의 문헌 종합 능력을 구조적으로 평가하려는 시의적절한 시도이다. 특히 인용 그래프 분석이라는 객관적 방법론은 재현가능하고 확장 가능한 평가 프레임으로 가치가 있으나, 샘플 규모 제약과 정성적 검증 부재로 인해 결론의 일반화 가능성이 제한된다. "인간 개입 없이 독립적 텍스트 초안 생성을 권하지 않는다"는 결론은 AI 도구 설계에 대한 실질적 권고를 제공한다.