Category: Data Science

Automated Focusing

matplotlib.axes.Axes.set_xlimnumpy.histogram 그래프에서 중요한 값들이 특정 범위에 몰려있으면 확대를 해야 합니다. matplotlib의 object oriented API는 .set_xlim()과 .set_ylim()을 제공해 줍니다. jupyter notebook에서 %matplotlib qt로 선언했다면 GUI로

Data Cleansing Functions

데이터 분석에 앞서 잘못된 부분을 찾아내고 이를 메꾸는 작업을 데이터 정리(data cleansing)이라고 합니다. 개별 데이터의 타입(type), 크기(length) 등이 잘못된 경우도 있고, 개별 데이터는 정상적이지만 이것들을 합쳤더니(merge) 결측치가 양산되거나 중복되는 경우도 있습니다. 분석이나 예측모델 생성시 문제의 원인이 되기 때문에 처음

Matplotlib-Tools

원문: by Aurélien Geron (Link) Translated by Chansung PARK (Link) Object Oriented API Addition by Jehyun LEE (Link) Tools - matplotlib 이 노트북은 matplotlib 라이브러리를 사용하여 아름다운 그래프를 그리는 방법을 보여줍니다. 이제현

Matplotlib Axes (1)

Matplotlib은 자유도가 높은 만큼 건드릴 곳이 많아서 익숙해지기가 영 만만치 않습니다. 저도 이 바람에 Matplotlib을 버릴까 했으나 Matplotlib에 의존하는 라이브러리가 너무 많더군요. 피할 수 없다면, 헷갈리지 않게 그리는 방법을 익혀봅시다.1234import matplotlib.pyplot as pltimport matplotlib

Pearson correlation between $ X $ and $ X^n $

wikipedia: Pearson Correlation Coefficient선형대수, 통계학, 기하적 직관 Pearson Correlation Coefficient는 두 데이터가 얼마나 연관성을 가지고 있는지 보여줍니다. 수치로는 -1에서 1 사이의 값으로 표현되고, 수식으로는 다음과 같이 표현됩니다.$$ \rho_{X, Y} = \frac{Cov

Plateau Detection

물을 끓이는 등 상태가 변할 때, 에너지가 흡수되어 온도가 일정하게 유지됩니다. 위와 같은 그래프에서 평평한 영역을 찾고, 각 구간의 대표점을 추출하겠습니다. 데이터 추출과 시각화 과정에서 사용되는 기법은 다음과 같습니다. Noise Reduction scipy.ndimage: signal averaging, median np.hanning, n

Matplotlib Colormap (2)

지난 글에서, scatter plot에 colormap을 입히고 colorbar를 제어하는 방법, 그리고 흑백 이미지에 colormap을 입히는 방법을 알아보았습니다. 이번 글에서는 어떤 colormap을 선택하는 것이 적절할지, 그리고 colormap 자체를 제어하고 활용하는 방법을 알아보도록 하겠습니다. 본 글은 공식 홈페이지의 번역과 요약을 토대로

Matplotlib Colormap (1)

어떤 프로그램이든 visualization을 해보신 분은 한번쯤 화려한 무지개빛 그림을 보고, “나도 저렇게 해보고 싶다” 라고 생각해보셨을 것 같습니다. 이런 그림은 colormap이라고 불리는 기능을 이용하는 것으로, 데이터를 색으로 표현하여 아름다움과 함께 직관적인 이해력을 높여줍니다. Matplotlib에서 colormap을 적용하는 방법

Matplotlib Colors

Matplotlib은 Visualization용 Library로만 알고 계시는 분들이 많습니다. 이미지 데이터의 색상 관련 operation을 위해서 opencv, pillow, scikit-image 등을 추가로 설치하고 사용하시는 분들이 많습니다만, 의외로 matplotlib에서도 색상 관련 기능을 제공하고 있습니다. Matplotlib 공식 홈

Matplotlib Defaults & Fonts

Matplotlib은 Python Visualization의 기둥이라고 해도 과언이 아닙니다. 자유도가 높아 원하는 그림을 자유롭게 그릴 수 있지만, 한편으로 명령어와 인자들이 자꾸 잊혀집니다. 약간의 짜증을 담아 Matplotlib의 기초 코드를 정리해둡니다. 혼동을 방지하기 위해 pyplot 기반 명령어는 제외하고 object oriented i