Tag: machine learning

Deep Learning by Open API

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번에는 직접 하는 코딩을 벗어나 공개된 딥러닝 모델을 사용하는 방법을 알아봅니다. 영상과 자연어 처리를 중심으로 OpenAI에서 제공하는 여러 모델이 있습니다. 강의실 예약 시간 문제로 마무리가 매끄럽지 못했습니다. 요약본이 번역되다 만 문제는 max_tokens

gaussian process

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 실험을 계획하고 최적 실험 조건을 탐색하는 방법들을 살펴봅니다. 전통적인 실험계획법(design of experiment), 반응표면법(response surface method)을 살펴보고, 효과적인 실험 설계를 도와주는 Gaussian Process와 이 바탕에

nonlinear models

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 가장 기초가 되는 선형 모델과 함께 위한 비선형 모델을 소개했습니다. 대부분의 데이터가 비선형이기 때문에 선형의 한계를 벗어나기 위해 다항변환과 커널을 이용합니다. 강의에서 하나를 빼먹었는데요, PCA는 데이터 값의 영향을 크게 받기 때문에 Stand

hyperparameter

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 머신러닝 성능 막판 끌어올리기, hyperparameter tuning을 소개했습니다. 문제, 데이터, 모델 선정에 최선을 다했다면 학습 환경을 최적화할 차례입니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Youtube L

트리 모델

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 decision tree와 random forest, xgboost를 비롯한 tree model을 공부하고 AutoML의 예시로 PyCaret을 소개했습니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Youtube Link)

데이터 분할과 교차 검증

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터를 class 비율대로 분류하는 stratified K fold를 소개하고, 모든 데이터를 학습과 검증에 활용하는 cross validation을 다룹니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Y

머신 러닝 파이프라인

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터 전처리와 머신 러닝을 안정적으로 수행할 수 있는 파이프라인을 소개합니다. one-hot encoding과 standard scaling도 그냥 하면 안 됩니다. train set으로 학습해서 test set에 적용해야 합니다

머신 러닝 기본 개념

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝 진도를 나가기로 했습니다. scikit-learn을 중심으로 머신러닝 실습을 할 예정입니다. 코드를 만지기 전 기본 개념을 전달드리는 강의를 진행했습니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상입니다 (Youtube Link) 바쁜 연구원 일정 속에 변동

Validation with Visualization (3)

데이터 불균형으로 인해 train, validation, test dataset의 결과가 따로 놉니다. 층화추출로 데이터를 최대한 균등하게 분할합시다. hyperparameter도 라이브러리를 사용해 편리하게 피팅합시다. 6. Validation set 고정 새로운 노트북을 만들어 데이터를 불러옵니다.123456789101112131415%matplot

Validation with Visualization (2)

contributor: 김홍비님 지난 글에 이어 GridSearchCV를 시각화해봅니다. 화면이라는 매체의 제약상 한 번에 두 개의 변수밖에 바꾸지 못합니다. 그런데도 제법 속이 뚫리고 다음에 뭘 할지 아이디어가 생깁니다. 4. 비선형 모델: kernel SVM sklearn: svm.SVR 선형 모델로는 한계가 있는 것 같습니다. 비선형성을 가