Tag: presentation

연구소의 문헌분석 기술 활용

2022년 12월 13일 모두의 연구소 초청으로 MODUPOP 강연을 했습니다. 몸담고 있는 연구원에서 적용하고 있는 문헌분석 기술을 공유드렸습니다. 짧은 시간에 압축해서 전달드린터라 세부 기술보다는 적용처 중심으로 봐주시면 감사하겠습니다. 저녁 7시부터 시작된 강의였고, 비와 눈으로 날씨가 많이 나쁜 날이었습니다. 귀중한 시간을 내서 온라인, 오프라인

Deep Learning by Open API

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번에는 직접 하는 코딩을 벗어나 공개된 딥러닝 모델을 사용하는 방법을 알아봅니다. 영상과 자연어 처리를 중심으로 OpenAI에서 제공하는 여러 모델이 있습니다. 강의실 예약 시간 문제로 마무리가 매끄럽지 못했습니다. 요약본이 번역되다 만 문제는 max_tokens

딥러닝 공개 모델 활용 정보 수집 효율화

한국전자통신연구원 오픈소스센터가 주축이 되어 ETRI Open Source Tech Day가 열렸습니다. 과학기술정보통신부가 주최하고 한국전자통신연구원, 한국과학기술정보연구원, 한국식품연구원, 한국에너지기술연구원, 한국원자력연구원, 한국화학연구원, 한국항공우주연구원이 공동 주관했습니다. 2021년 내가 해온 연구에 데이터 분석 끼얹기라는 제목으로

gaussian process

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 실험을 계획하고 최적 실험 조건을 탐색하는 방법들을 살펴봅니다. 전통적인 실험계획법(design of experiment), 반응표면법(response surface method)을 살펴보고, 효과적인 실험 설계를 도와주는 Gaussian Process와 이 바탕에

nonlinear models

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 가장 기초가 되는 선형 모델과 함께 위한 비선형 모델을 소개했습니다. 대부분의 데이터가 비선형이기 때문에 선형의 한계를 벗어나기 위해 다항변환과 커널을 이용합니다. 강의에서 하나를 빼먹었는데요, PCA는 데이터 값의 영향을 크게 받기 때문에 Stand

hyperparameter

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 머신러닝 성능 막판 끌어올리기, hyperparameter tuning을 소개했습니다. 문제, 데이터, 모델 선정에 최선을 다했다면 학습 환경을 최적화할 차례입니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Youtube L

트리 모델

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 decision tree와 random forest, xgboost를 비롯한 tree model을 공부하고 AutoML의 예시로 PyCaret을 소개했습니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Youtube Link)

Open API를 이용한 고속 논문 분석

저는 데이터, AI 담당자로서 낯선 분야의 업무를 맡아 논문 작성을 요구받고 있습니다. 공저자로서 데이터 분석이나 AI 모델링 파트만 작성하라면 그냥 하면 됩니다. 그러나 주저자로서 서론부터 작성하는 일은 너무 어렵습니다. 이 분야의 흐름을 파악하고 다른 이들의 연구를 언급해야 하는데 대량의 논문을 읽기엔 단어부터 낯설기 때문입니다. 처음 보는

데이터 분할과 교차 검증

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터를 class 비율대로 분류하는 stratified K fold를 소개하고, 모든 데이터를 학습과 검증에 활용하는 cross validation을 다룹니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Y

머신 러닝 파이프라인

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터 전처리와 머신 러닝을 안정적으로 수행할 수 있는 파이프라인을 소개합니다. one-hot encoding과 standard scaling도 그냥 하면 안 됩니다. train set으로 학습해서 test set에 적용해야 합니다