KDE + threshold
밀도 함수는 데이터 분포를 볼 때 가장 많이 그리는 그림 중 하나입니다. 특정 값을 기준으로 Pass와 Fail을 정한다고 할 때, 전체의 비율도 중요합니다. seaborn kdeplot을 살짝 다듬어서 쪼개고 비율을 계산합니다. 1. 오늘의 목표 오늘 우리는 데이터를 선별하는 데 쓰는, 이런 그림을 그릴 겁니다. 특정 값을 기준으로 왼쪽은 Fail,
밀도 함수는 데이터 분포를 볼 때 가장 많이 그리는 그림 중 하나입니다. 특정 값을 기준으로 Pass와 Fail을 정한다고 할 때, 전체의 비율도 중요합니다. seaborn kdeplot을 살짝 다듬어서 쪼개고 비율을 계산합니다. 1. 오늘의 목표 오늘 우리는 데이터를 선별하는 데 쓰는, 이런 그림을 그릴 겁니다. 특정 값을 기준으로 왼쪽은 Fail,
RPA(Robotic Process Automation: 업무 자동화) 과제를 하려고 합니다. RPA를 적용하면 효용이 얼마나 좋은지를 설득하기 위한 그림을 그립니다. RPA 도입 전과 후를 비교하는 그림을 그려서 보여줍시다. 1. 행정 업무 어떤 가상의 데이터 관련 행정 업무가 있다고 합시다. 현재는 총 2천만원의 용역비를 포함해 12주가 걸립니다
PyCon Korea 2022에서 한 발표 영상입니다. Matplotlib을 데이터를 그리는 도구로 많이 알고 계십니다. 하지만 Matplotlib은 시각화 라이브러리 이상의 생태계입니다. seaborn을 사용해 데이터 시각화 결과물의 퀄리티를 높일 수 있고, 생태계의 다른 라이브러리를 사용해 그린 그림을 Matplotlib으로 편집할 수 있습니다.
추석입니다. 빛나는 보름달을 그립니다. 1. 추석 달 오마이뉴스: 이번 추석, ‘초 슈퍼문’ 볼 수 있다 (2015.09.22.) 보름달 주위로 빛이 살짝 스며나올 때가 있습니다. 구름이 옅게 끼거나 공기가 습할 때 일부가 굴절되는 것입니다. 2. 빛이 스미는 보름달2.1. 보름달 빛이 하늘에 번지는 보름달을 그립니다. 먼저, 2022 x 2022
시각화에서 색은 매우 중요한 요소입니다. 중요 데이터를 강조하기 위해 특정 영역의 색을 다르게 지정하기도 합니다. HLS 색공간을 사용해 특정 데이터만 강조합니다. 1. 중요 데이터 강조 Claus Wikle, “데이터 시각화 교과서” 아래 그림은 데이터 시각화 교과서에 수록된 데이터 강조 사례입니다. 여러 항공사 중 Delta와 American만
seaborn에는 regplot이라는 기능이 있습니다. 산점도, 회귀선, 신뢰 구간을 동시에 표현해주는 강력한 기능입니다. 그리고 같은 결과를 출력하는 lmplot이 있습니다. 같은 점과 다른 점을 확인합니다. 1. seaborn regplot seaborn.regplot seaborn에는 regplot 함수가 있습니다. scatter plot, r
경향신문과 언더스코어가 공동으로 조사한 ‘부모찬스’기사가 실렸습니다. 기사 내용과 별개로, 이 기사에 활용된 KDE plot에 대해 여러 분들이 여러 의견을 표했습니다. KDE plot의 특징과 한계를 살펴봅니다. 언더스코어경향신문: 두 얼굴의 공정(1) 조국과 정호영, 누가 더 ‘불공정’합니까?경향신문: 정치 성향에 따라 부모찬스에 들이댄 ‘공정 잣
Seaborn violin plot은 아름답습니다. 매끈한 곡선은 데이터의 분포를 직관적으로 알게 해 줍니다. color와 palette 매개변수로 violin plot의 색을 지정할 수 있습니다. 그러나 특정 violin plot만 색을 바꾸어 강조하는 방법은 잘 알려져있지 않습니다. 1. 예제 데이터 seaborn의 tips 데이터셋을 사용합니다.1
seaborn의 heatmap은 매우 강력한 도구입니다. 한 줄의 명령으로 colormap과 annotation, colorbar가 붙은 정돈된 그림이 나옵니다. 그런데 colorbar를 조금 고치고 싶다면, 어떻게 할까요? 1. Seaborn Heatmap1.1. 예제 데이터 만들기 Seaborn에 내장된 펭귄 데이터셋을 사용합시다.123456789%
Legend(범례)는 데이터의 의미 파악을 도와주는 도구입니다. 그러나 그림이 여럿 있을 때 각각 붙은 Legend는 방해가 되기도 합니다. Legend를 한데 모아 그리는 방법을 알아봅니다. 1. Sample Data 먼저 필요한 라이브러리들을 불러오고,12345678%matplotlib inlineimport numpy as npimport pand