Archive: 2021

Validation with Visualization (2)

contributor: 김홍비님 지난 글에 이어 GridSearchCV를 시각화해봅니다. 화면이라는 매체의 제약상 한 번에 두 개의 변수밖에 바꾸지 못합니다. 그런데도 제법 속이 뚫리고 다음에 뭘 할지 아이디어가 생깁니다. 4. 비선형 모델: kernel SVM sklearn: svm.SVR 선형 모델로는 한계가 있는 것 같습니다. 비선형성을 가

Validation with Visualization (1)

데이터 시각화는 머신러닝 과정을 확인하기 좋습니다. 하이퍼파라미터에 따라 확인할 값이 여럿 있고, 숫자로 확인할 수도 있지만 눈에 잘 들어오지 않아 그림으로 표현해 보았습니다. 1. 데이터 & 분석 설정 What’s new in Matplotlib 3.4.0 필요한 라이브러리들을 불러옵니다. 업데이트된 matplotlib 버전 3.4.1을 사

사람을 향한 데이터 시각화

D&I Learning Day 2021에서 발표한 내용입니다. 누군가에게 보이기 위한 작업으로서의 데이터 시각화롤 고민했고,최선의 의사 결정을 위한 조언이라는 결론을 얻었습니다. 예시를 위해 지난 글을 작성했고업무적, 기술적인 면이 아닌 시각적인 면에서 제 의도와 이유를 설명하는 발표입니다. 다양성과 포용성을 위한 AI라는 취지의 행사입

Visualization with Messages

데이터 시각화는 예쁜 그림에 머물러서는 안 된다고 생각합니다. 데이터 분석의 일환인 만큼 분석의 목적에 충실해야 하는 것은 물론이고, 데이터 시각화를 수행하는 사람만큼 데이터를 깊이 파는 사람이 없습니다. 최고의 조언자로서의 데이터 시각화에 도전해봅니다. 1. 데이터 Pega Devlog: 수능 Trend Visualization한국교육과정평가원 대학수

색의 속성에 대한 단어들

contributor : Jerry Kim 색을 고르다 보면 이런 단어들을 만납니다:Brightness, Lightness, Value, Luminosity, Luma 우리 말로는 모두 명도, 명도, 명도, 명도, 명도이지만 의미가 모두 다릅니다. 같은 뜻으로 생각하면 실수할 수도 있으니 한번 짚고 넘어갑시다. 1. 용어 정리 Gilchrist, “

머신러닝 모델링의 흔한 실수들

제 직장에서 진행한 에너지 + AI 학습조직 발표입니다. 2021.02.24 발표영상입니다. 여러 커뮤니티를 통해 머신러닝, 딥러닝 실수 사례를 모았습니다. 사례를 모아주신 분들께 깊은 감사 말씀을 드립니다. 60여건의 사례 중 데이터 관련 사례를 일부 모아 발표했습니다. 발표자료는 여기에서 다운로드 받으실 수 있습니다.

Density Plot with Colormap

시각화는 데이터를 그림으로 표현하는 작업입니다. 그런데 한번 그림이 되면 진짜 그림처럼 취급할 수 있습니다. 밀도함수에 컬러맵을 입혀봅시다. 1. Imitating Ridge Plot by R Gallery of ggridges examplesPega Devlog: Ridgeline Plot 인터넷을 다니다가 R로 그려진 멋진 그림을 봤습니다.

Matplotlib plot colors

시각화에서 색상은 중요한 요소입니다. 그러나 관성적으로 프로그램이 제공하는 기본값을 사용하는 분들이 많습니다. matplotlib은 푸짐한 상을 차려놓고 우리를 기다리고 있습니다. 골라봅시다. 1. Example Bed 화면상에서 색상은 대개 RGB 3채널로 구성됩니다. 여기에 불투명도 Alpha가 붙어 RGBA 4채널이 되기도 합니다. 같은 색상도 숫

Plot with Variable Class

시각화의 대상은 데이터만이 아닙니다. 데이터를 비롯해 이름, 단위를 써줘야 하고 데이터를의 분석결과를 함께, 또는 따로 강조해서 그려야 합니다. 데이터마다 붙는 꼬리표와 파생변수를 클래스를 이용해서 정리해 봅시다. 1. 데이터 10만개 정도의 상자 데이터가 있습니다. 길이(length), 너비(width), 높이(height)가 있고, 여기로부터 입체

Income from Two Companies (2)

우리의 A씨는 투잡을 하는 영업사원입니다. A씨라는 가상의 인물 계좌를 어떻게 만들었는지 공개합니다. numpy.random, datetime을 pandas.DataFrame에 적용한 결과입니다. 전체 코드는 여기에서 다운로드 가능합니다. 일단 데이터를 만든다는 목표로 만든, 거의 라이브코딩 수준 코드입니다. 코드가 거칠더라도 양해바랍니다. 1.