Tag: matplotlib

Matplotlib plot colors

시각화에서 색상은 중요한 요소입니다. 그러나 관성적으로 프로그램이 제공하는 기본값을 사용하는 분들이 많습니다. matplotlib은 푸짐한 상을 차려놓고 우리를 기다리고 있습니다. 골라봅시다. 1. Example Bed 화면상에서 색상은 대개 RGB 3채널로 구성됩니다. 여기에 불투명도 Alpha가 붙어 RGBA 4채널이 되기도 합니다. 같은 색상도 숫

Plot with Variable Class

시각화의 대상은 데이터만이 아닙니다. 데이터를 비롯해 이름, 단위를 써줘야 하고 데이터를의 분석결과를 함께, 또는 따로 강조해서 그려야 합니다. 데이터마다 붙는 꼬리표와 파생변수를 클래스를 이용해서 정리해 봅시다. 1. 데이터 10만개 정도의 상자 데이터가 있습니다. 길이(length), 너비(width), 높이(height)가 있고, 여기로부터 입체

matplotlib fonts

데이터 시각화 결과물에는 글자가 많이 들어갑니다. 축 레이블, 눈금 레이블, 타이틀 뿐 아니라 그림 위에 데이터를 명시하기도 합니다. 글꼴, 글자 크기, 스타일 등을 자유자재로 다뤄봅니다. 1. Matplotlib 글꼴 matplotlib.axes.Axes.textmatplotlib.font_managermatplotlib User’s Guide #Te

Picking and Modifying Colors

데이터 시각화를 언어라고 한다면 색상은 단어입니다. “여기는 무엇입니다”를 보여주기도 하고 “얼마나 큽니다”를 보여주기도 합니다. 좋은 단어는 상황을 정확하게 전달할 뿐 아니라 글을 아름답게 합니다. 좋은 색상은 데이터를 효과적으로 전달할 뿐 아니라 보는 사람의 마음을 즐겁고 편안하게 합니다. 1. 좋은 색상 가져오기 Finding the right c

PCA of X features with Y

PCA는 데이터의 숨겨진 패턴을 드러내줍니다. Feature Space의 데이터 분포 중 가장 넓게 분포한 것부터 찾아주기 때문에 X Feature들만으로는 보기 어려운 패턴을 찾을 수 있습니다. X 인자들의 분포 패턴에 Y feature를 얹어서 그려봅시다. Feature engineering을 위한 실마리를 찾고자 합니다. 1. 데이터 이번 예시는

matplotlib plot()

matplotlib의 가장 기본적인 시각화 명령은 plot()입니다. 데이터를 line plot으로 표현하는 명령인데 marker만 남기면 scatter plot도 가능합니다. 여러 옵션들을 한 눈에 그려봅니다. 1. Sample Data 수능 데이터에서 일부를 가져옵니다.12x = np.array([2009, 2010, 2011, 2012, 2013]

수능 Trend Visualization (3)

Contributor 김동윤님 지난 글에서 spines, grid, legend를 정리했습니다. grid를 넣으려고 minor tick도 설정해 보았구요. 기본 데이터는 다 그렸는데, 이걸로는 아쉽습니다. 메시지를 추출해서 전달해봅시다. 5. 토달기 : annotate 지원자 수는 수능을 보겠다고 원서를 제출한 사람 수고 응시자 수는 실제로 가서

수능 Trend Visualization (2)

지난 글에서 수능 데이터를 시각화해봤습니다. 그림은 나왔는데 틀과 legend가 정리되지 않았습니다. spine, grid, legend를 정리하고 부가 정보를 넣어봅시다. 이번 글에서는 부분적으로 필요한 코드 위주로 기술하고, 가끔 전체 코드를 보이도록 하겠습니다. 2. spines Pega Devlog: Spines & Grids lin

수능 Trend Visualization (1)

대학수학능력시험은 94학번 이후 대학 진학을 결정하는 시험입니다. 얼마 전에 끝난 2021학년도 수능을 포함해 29회의 수능이 있었습니다. 근 30년간 응시생과 점수에 대한 트렌드를 확인해 보겠습니다. 1. 데이터1.1. 데이터 확보 한국교육과정평가원 대학수학능력시험 정보 수학능력시험 관련 데이터는 공공데이터 포털에서 다운받을 수 있습니다. 여러