Category: Data Science

Auto Contrast on SEM image

영상 촬영을 하다 보면 결과물이 마음에 들지 않는 여러 이유가 있습니다. 애초에 잘 찍으면 되겠지만 장비나 숙련도 등의 문제로 한계가 있습니다. 전자현미경 사진은 여기에 시료의 상태까지 한 몫 합니다. 방해 요소를 제외하고 자동 명도 및 대비 보정을 하는 방법을 알아봅니다. 1. 예제 이미지 위와 같은 전자현미경 사진을 얻었다고 합시다. 전자현미경은

혼란한 Matplotlib에서 질서 찾기

PyCon Korea 2022에서 한 발표 영상입니다. Matplotlib을 데이터를 그리는 도구로 많이 알고 계십니다. 하지만 Matplotlib은 시각화 라이브러리 이상의 생태계입니다. seaborn을 사용해 데이터 시각화 결과물의 퀄리티를 높일 수 있고, 생태계의 다른 라이브러리를 사용해 그린 그림을 Matplotlib으로 편집할 수 있습니다.

Python Script in Power BI Desktop

Microsoft가 출시한 Power BI는 강력합니다. 윈도 환경에서 데이터를 쉽게 시각화할 수 있을 뿐 아니라 온라인 배포를 통해 동료와 공유하기도 쉽습니다. 한편으로 데이터 불러오기, 전처리, 시각화를 python script로 할 수도 있습니다. 공식 문서도 풍부하여 익히기 좋습니다. 1. Power BI 설치 Microsoft Learn:

Nature Methods- Points of significance

Nature지에서는 연구자들의 올바른 통계 분석 역량을 배양하고자 컬럼을 연재했습니다. Points of Significance라는 이름으로 연재했으며, 데이터의 올바른 해석과 실험 계획에 대한 가이드를 주고 있습니다. 주로 정해진 필진이 길지 않은 기사를 쓰는데 Nature Methods에 실립니다. 간간이 Nature 자매지에 투고되는 분석이 얼마나

nonlinear models

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 가장 기초가 되는 선형 모델과 함께 위한 비선형 모델을 소개했습니다. 대부분의 데이터가 비선형이기 때문에 선형의 한계를 벗어나기 위해 다항변환과 커널을 이용합니다. 강의에서 하나를 빼먹었는데요, PCA는 데이터 값의 영향을 크게 받기 때문에 Stand

glowing full moon

추석입니다. 빛나는 보름달을 그립니다. 1. 추석 달 오마이뉴스: 이번 추석, ‘초 슈퍼문’ 볼 수 있다 (2015.09.22.) 보름달 주위로 빛이 살짝 스며나올 때가 있습니다. 구름이 옅게 끼거나 공기가 습할 때 일부가 굴절되는 것입니다. 2. 빛이 스미는 보름달2.1. 보름달 빛이 하늘에 번지는 보름달을 그립니다. 먼저, 2022 x 2022

Emphasis on main data

시각화에서 색은 매우 중요한 요소입니다. 중요 데이터를 강조하기 위해 특정 영역의 색을 다르게 지정하기도 합니다. HLS 색공간을 사용해 특정 데이터만 강조합니다. 1. 중요 데이터 강조 Claus Wikle, “데이터 시각화 교과서” 아래 그림은 데이터 시각화 교과서에 수록된 데이터 강조 사례입니다. 여러 항공사 중 Delta와 American만

Text Processing Functions

자연어 처리는 품이 많이 듭니다. 단어부터 문장, 맥락까지 처리할 것이 한 두 가지가 아닙니다. 그러면서도 반복이 많습니다. 함수로 만듭니다. 초록 요약 및 키워드 추출 Pega Devlog: Open API를 이용한 고속 논문 분석 우연히 시작한 문헌 분석 일이 형태를 갖춰 갑니다. 주먹구구로 시작했던 일을 체계적으로 정리하고자 합니다. 무엇보다

Matplotlib Animation

정지된 그림으로는 볼 수 없는 것들이 있습니다. 시간에 따른 변화나 입체 도형의 뒷면이 그것입니다. 애니메이션을 활용해 이를 보완합니다. 1. Matplotlib animation matplotlib.animation Matplotlib에서 사용할 수 있는 애니메이션은 두 가지가 있습니다. Artist 객체 변화를 저장하는 ArtistAnimati

hyperparameter

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번 시간에는 머신러닝 성능 막판 끌어올리기, hyperparameter tuning을 소개했습니다. 문제, 데이터, 모델 선정에 최선을 다했다면 학습 환경을 최적화할 차례입니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Youtube L