Open Datasets in Learning Analytics: Trends, Challenges, and Best PRACTICE

저자: Valdemar Švábenský, Brendan Flanagan, Erwin Daniel López Zapata, Atsushi Shimada | 날짜: 2026-02-19 | DOI: 10.1145/3798096


Essence

Figure 2

Fig. 2. Distributions of dataset frequency across educational topics and levels of students.

본 논문은 학습분석(Learning Analytics), 교육데이터마이닝(Educational Data Mining), 교육용 AI의 세 분야에서 공개 데이터셋의 현황을 파악하고, 데이터 공유 모범 사례를 제시하는 체계적 조사 연구이다.

Motivation

Achievement

Figure 2

Fig. 2. Distributions of dataset frequency across educational topics and levels of students.

How

Figure 1

Fig. 1. PRISMA flow diagram. Generated using the tool by Haddaway et al. [146].

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

총평: 본 논문은 학습분석 커뮤니티의 공개 데이터 현황에 대한 가장 포괄적이고 최신의 체계적 조사 연구이며, 실질적인 PRACTICE 지침 제공과 신규 데이터셋 인벤토리 공개를 통해 학습분석 분야의 개방 과학 실천을 촉진하는 중요한 기여를 한다.

같이 보면 좋은 논문

기반 연구
촉매 발견을 위한 공개 데이터셋과 도메인 챌린지 설계가 교육 분야 공개 데이터셋의 품질 기준과 활용 모범 사례 수립에 방법론적 기반을 제공한다.
기반 연구
OLMo의 완전 공개 접근법이 학습분석 분야 공개 데이터셋의 투명성과 재현가능성 모범 사례 수립에 방법론적 기반을 제공한다.
기반 연구
과학 분야 LLM 벤치마크 체계가 교육 분야 공개 데이터셋의 품질 평가와 모범 사례 도출에 방법론적 기반을 제공한다.
다른 접근
교육 분야 공개 데이터셋의 모범 사례가 촉매 발견을 위한 OC20 데이터셋과 다른 분야에서 데이터 공유 전략을 제시한다.
후속 연구
언어모델 과학 연구를 위한 완전 공개 접근법을 교육 분야 공개 데이터셋의 모범 사례와 품질 기준으로 확장한다.
후속 연구
과학 분야 LLM의 190개 벤치마크 체계를 교육 분야로 확장하여 학습분석과 교육용 AI의 데이터 품질 평가 기준을 제시한다.
응용 사례
메타데이터 통합 아이디어 생성 방법론을 교육 분야 공개 데이터셋 활용 연구에 적용할 수 있는 구체적 사례를 제공한다.
← 목록으로 돌아가기