Archive: 2021

Income from Two Companies (1)

수입이 불규칙한 영업사원을 가정하고, 은행계좌를 간단하게 분석합니다. 데이터프레임의 문자열 일부를 이용해 데이터를 분류합니다. 분석을 위한 데이터도 직접 만들어봅니다. 1. 입금 데이터 급여통장을 지정하고 모든 수입을 통일하면 창구는 일원화됩니다. 그러나 통장에 찍히는 급여내역이 그다지 친절하지 않으면 정리가 어렵습니다. 투잡을 하는 영업사원 A씨

matplotlib fonts

데이터 시각화 결과물에는 글자가 많이 들어갑니다. 축 레이블, 눈금 레이블, 타이틀 뿐 아니라 그림 위에 데이터를 명시하기도 합니다. 글꼴, 글자 크기, 스타일 등을 자유자재로 다뤄봅니다. 1. Matplotlib 글꼴 matplotlib.axes.Axes.textmatplotlib.font_managermatplotlib User’s Guide #Te

Picking and Modifying Colors

데이터 시각화를 언어라고 한다면 색상은 단어입니다. “여기는 무엇입니다”를 보여주기도 하고 “얼마나 큽니다”를 보여주기도 합니다. 좋은 단어는 상황을 정확하게 전달할 뿐 아니라 글을 아름답게 합니다. 좋은 색상은 데이터를 효과적으로 전달할 뿐 아니라 보는 사람의 마음을 즐겁고 편안하게 합니다. 1. 좋은 색상 가져오기 Finding the right c

PCA of X features with Y

PCA는 데이터의 숨겨진 패턴을 드러내줍니다. Feature Space의 데이터 분포 중 가장 넓게 분포한 것부터 찾아주기 때문에 X Feature들만으로는 보기 어려운 패턴을 찾을 수 있습니다. X 인자들의 분포 패턴에 Y feature를 얹어서 그려봅시다. Feature engineering을 위한 실마리를 찾고자 합니다. 1. 데이터 이번 예시는

matplotlib plot()

matplotlib의 가장 기본적인 시각화 명령은 plot()입니다. 데이터를 line plot으로 표현하는 명령인데 marker만 남기면 scatter plot도 가능합니다. 여러 옵션들을 한 눈에 그려봅니다. 1. Sample Data 수능 데이터에서 일부를 가져옵니다.12x = np.array([2009, 2010, 2011, 2012, 2013]