Tag: KIER

데이터 분할과 교차 검증

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터를 class 비율대로 분류하는 stratified K fold를 소개하고, 모든 데이터를 학습과 검증에 활용하는 cross validation을 다룹니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Y

머신 러닝 파이프라인

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터 전처리와 머신 러닝을 안정적으로 수행할 수 있는 파이프라인을 소개합니다. one-hot encoding과 standard scaling도 그냥 하면 안 됩니다. train set으로 학습해서 test set에 적용해야 합니다

머신 러닝 기본 개념

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝 진도를 나가기로 했습니다. scikit-learn을 중심으로 머신러닝 실습을 할 예정입니다. 코드를 만지기 전 기본 개념을 전달드리는 강의를 진행했습니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상입니다 (Youtube Link) 바쁜 연구원 일정 속에 변동

머신러닝 모델링의 흔한 실수들

제 직장에서 진행한 에너지 + AI 학습조직 발표입니다. 2021.02.24 발표영상입니다. 여러 커뮤니티를 통해 머신러닝, 딥러닝 실수 사례를 모았습니다. 사례를 모아주신 분들께 깊은 감사 말씀을 드립니다. 60여건의 사례 중 데이터 관련 사례를 일부 모아 발표했습니다. 발표자료는 여기에서 다운로드 받으실 수 있습니다.