Category: Data Science

연구소의 문헌분석 기술 활용

2022년 12월 13일 모두의 연구소 초청으로 MODUPOP 강연을 했습니다. 몸담고 있는 연구원에서 적용하고 있는 문헌분석 기술을 공유드렸습니다. 짧은 시간에 압축해서 전달드린터라 세부 기술보다는 적용처 중심으로 봐주시면 감사하겠습니다. 저녁 7시부터 시작된 강의였고, 비와 눈으로 날씨가 많이 나쁜 날이었습니다. 귀중한 시간을 내서 온라인, 오프라인

Impact of RPA

RPA(Robotic Process Automation: 업무 자동화) 과제를 하려고 합니다. RPA를 적용하면 효용이 얼마나 좋은지를 설득하기 위한 그림을 그립니다. RPA 도입 전과 후를 비교하는 그림을 그려서 보여줍시다. 1. 행정 업무 어떤 가상의 데이터 관련 행정 업무가 있다고 합시다. 현재는 총 2천만원의 용역비를 포함해 12주가 걸립니다

Deep Learning by Open API

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번에는 직접 하는 코딩을 벗어나 공개된 딥러닝 모델을 사용하는 방법을 알아봅니다. 영상과 자연어 처리를 중심으로 OpenAI에서 제공하는 여러 모델이 있습니다. 강의실 예약 시간 문제로 마무리가 매끄럽지 못했습니다. 요약본이 번역되다 만 문제는 max_tokens

Gaussian Process Practice (3) Beware Boundaries

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 주의사항을 알려드립니다. Gaussian Process는 경계조건에 매우 취약합니다. 1. Gaussian Process의 한계 scikit-learn: Gaussian Process Regression: basic introductory examp

Gaussian Process Practice (2) Kernels

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 여러 커널의 특징을 알아보고 사용처를 알아봅니다. 1. Data Preparation scikit-learn: Gaussian Process Regression: basic introductory example 1.1. example data 지난

Gaussian Process Practice (1) 1D

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 오차가 없을 때와 있을 때를 비교합니다. 1. Data Preparation scikit-learn: Gaussian Process Regression: basic introductory example 1.1. example data Gaussia

딥러닝 공개 모델 활용 정보 수집 효율화

한국전자통신연구원 오픈소스센터가 주축이 되어 ETRI Open Source Tech Day가 열렸습니다. 과학기술정보통신부가 주최하고 한국전자통신연구원, 한국과학기술정보연구원, 한국식품연구원, 한국에너지기술연구원, 한국원자력연구원, 한국화학연구원, 한국항공우주연구원이 공동 주관했습니다. 2021년 내가 해온 연구에 데이터 분석 끼얹기라는 제목으로

gaussian process

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 실험을 계획하고 최적 실험 조건을 탐색하는 방법들을 살펴봅니다. 전통적인 실험계획법(design of experiment), 반응표면법(response surface method)을 살펴보고, 효과적인 실험 설계를 도와주는 Gaussian Process와 이 바탕에

Auto Contrast on SEM image

영상 촬영을 하다 보면 결과물이 마음에 들지 않는 여러 이유가 있습니다. 애초에 잘 찍으면 되겠지만 장비나 숙련도 등의 문제로 한계가 있습니다. 전자현미경 사진은 여기에 시료의 상태까지 한 몫 합니다. 방해 요소를 제외하고 자동 명도 및 대비 보정을 하는 방법을 알아봅니다. 1. 예제 이미지 위와 같은 전자현미경 사진을 얻었다고 합시다. 전자현미경은

혼란한 Matplotlib에서 질서 찾기

PyCon Korea 2022에서 한 발표 영상입니다. Matplotlib을 데이터를 그리는 도구로 많이 알고 계십니다. 하지만 Matplotlib은 시각화 라이브러리 이상의 생태계입니다. seaborn을 사용해 데이터 시각화 결과물의 퀄리티를 높일 수 있고, 생태계의 다른 라이브러리를 사용해 그린 그림을 Matplotlib으로 편집할 수 있습니다.