Category: Data Science

Gaussian Process Practice (3) Beware Boundaries

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 주의사항을 알려드립니다. Gaussian Process는 경계조건에 매우 취약합니다. 1. Gaussian Process의 한계 scikit-learn: Gaussian Process Regression: basic introductory examp

Gaussian Process Practice (2) Kernels

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 여러 커널의 특징을 알아보고 사용처를 알아봅니다. 1. Data Preparation scikit-learn: Gaussian Process Regression: basic introductory example 1.1. example data 지난

Gaussian Process Practice (1) 1D

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 오차가 없을 때와 있을 때를 비교합니다. 1. Data Preparation scikit-learn: Gaussian Process Regression: basic introductory example 1.1. example data Gaussia

딥러닝 공개 모델 활용 정보 수집 효율화

한국전자통신연구원 오픈소스센터가 주축이 되어 ETRI Open Source Tech Day가 열렸습니다. 과학기술정보통신부가 주최하고 한국전자통신연구원, 한국과학기술정보연구원, 한국식품연구원, 한국에너지기술연구원, 한국원자력연구원, 한국화학연구원, 한국항공우주연구원이 공동 주관했습니다. 2021년 내가 해온 연구에 데이터 분석 끼얹기라는 제목으로

gaussian process

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 실험을 계획하고 최적 실험 조건을 탐색하는 방법들을 살펴봅니다. 전통적인 실험계획법(design of experiment), 반응표면법(response surface method)을 살펴보고, 효과적인 실험 설계를 도와주는 Gaussian Process와 이 바탕에

Auto Contrast on SEM image

영상 촬영을 하다 보면 결과물이 마음에 들지 않는 여러 이유가 있습니다. 애초에 잘 찍으면 되겠지만 장비나 숙련도 등의 문제로 한계가 있습니다. 전자현미경 사진은 여기에 시료의 상태까지 한 몫 합니다. 방해 요소를 제외하고 자동 명도 및 대비 보정을 하는 방법을 알아봅니다. 1. 예제 이미지 위와 같은 전자현미경 사진을 얻었다고 합시다. 전자현미경은

혼란한 Matplotlib에서 질서 찾기

PyCon Korea 2022에서 한 발표 영상입니다. Matplotlib을 데이터를 그리는 도구로 많이 알고 계십니다. 하지만 Matplotlib은 시각화 라이브러리 이상의 생태계입니다. seaborn을 사용해 데이터 시각화 결과물의 퀄리티를 높일 수 있고, 생태계의 다른 라이브러리를 사용해 그린 그림을 Matplotlib으로 편집할 수 있습니다.

Python Script in Power BI Desktop

Microsoft가 출시한 Power BI는 강력합니다. 윈도 환경에서 데이터를 쉽게 시각화할 수 있을 뿐 아니라 온라인 배포를 통해 동료와 공유하기도 쉽습니다. 한편으로 데이터 불러오기, 전처리, 시각화를 python script로 할 수도 있습니다. 공식 문서도 풍부하여 익히기 좋습니다. 1. Power BI 설치 Microsoft Learn:

Nature Methods- Points of significance

Nature지에서는 연구자들의 올바른 통계 분석 역량을 배양하고자 컬럼을 연재했습니다. Points of Significance라는 이름으로 연재했으며, 데이터의 올바른 해석과 실험 계획에 대한 가이드를 주고 있습니다. 주로 정해진 필진이 길지 않은 기사를 쓰는데 Nature Methods에 실립니다. 간간이 Nature 자매지에 투고되는 분석이 얼마나

nonlinear models

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 가장 기초가 되는 선형 모델과 함께 위한 비선형 모델을 소개했습니다. 대부분의 데이터가 비선형이기 때문에 선형의 한계를 벗어나기 위해 다항변환과 커널을 이용합니다. 강의에서 하나를 빼먹었는데요, PCA는 데이터 값의 영향을 크게 받기 때문에 Stand