Category: Data Science

머신러닝 모델링의 흔한 실수들 (2)

많은 분들께서 모아주신 머신러닝, 딥러닝 실수 사례 두번째 이야기를 2021 AI Festival에서 발표했습니다. 사례를 모아주신 분들께 깊은 감사 말씀을 드립니다. 60여건의 사례 중 데이터 관련 사례를 일부 모아 발표했습니다. 발표자료는 여기에서 다운로드 받으실 수 있습니다. 2021 AI Festival 제 발표는 44분 30초부터 시작

Paper Search using ScopusAPI

연구자라면 논문 검색이 일상입니다. 매년 출간되는 논문의 편 수는 기하급수적으로 늘고 있습니다. 새로운 논문을 찾거나 전체적인 트렌드를 파악하기가 점점 어려워집니다. elsevier사가 제공하는 API를 사용해서 파이썬으로 데이터를 받고 정리합시다. 1. ElsevierElsevierElsevier Developers 1.1. 계정 Elsevier에 가

Streamgraph - Movie Genres

여러 범주의 Area chart를 누적하면 stacked chart plot이 됩니다. Matplotlib의 stackplot() 함수를 사용하면 쉽게 그릴 수 있습니다. baseline 옵션으로 모양을 제어합니다. kaggle에서 받아온 영화 데이터로 그려봅시다. 1. Stackplot and Streamgraph matplotlib: Stackplo

Matplotlib 3D Plots (2)

Matplotlib으로 3D Plot을 할 수 있습니다. 많은 분들이 알고 있는 사실이지만 적극적으로 쓰이지 않습니다. 막상 쓰려면 너무 낯설기도 하고 잘 모르기도 하기 때문입니다. Reference matplotlib tutorial: The mplot3d Toolkitnumpy.meshgrid 3. 3D Visualization 일반적으로는 x,

Matplotlib 3D Plots (1)

Matplotlib으로 3D Plot을 할 수 있습니다. 많은 분들이 알고 있는 사실이지만 적극적으로 쓰이지 않습니다. 막상 쓰려면 너무 낯설기도 하고 잘 모르기도 하기 때문입니다. Reference matplotlib tutorial: The mplot3d Toolkitnumpy.meshgrid 1. 예제 데이터1.1. 공식 예제 데이터 위 그림

Seaborn Heatmap & Colorbar Control

seaborn의 heatmap은 매우 강력한 도구입니다. 한 줄의 명령으로 colormap과 annotation, colorbar가 붙은 정돈된 그림이 나옵니다. 그런데 colorbar를 조금 고치고 싶다면, 어떻게 할까요? 1. Seaborn Heatmap1.1. 예제 데이터 만들기 Seaborn에 내장된 펭귄 데이터셋을 사용합시다.123456789%

Datetime X-axis Control

시계열 데이터를 다루면 x축에 날짜와 시간이 붙습니다. x축 데이터는 datetime 객체일 수도 있고, 그냥 string일 수도 있습니다. 여러 그림을 겹쳐 그릴 때 종종 문제가 됩니다. 원인과 해결책을 알아봅니다. 1. 예제 데이터 라이브러리 호출12345678%matplotlib inline# 라이브러리 호출import numpy as npimpo

Legend Control

Legend(범례)는 데이터의 의미 파악을 도와주는 도구입니다. 그러나 그림이 여럿 있을 때 각각 붙은 Legend는 방해가 되기도 합니다. Legend를 한데 모아 그리는 방법을 알아봅니다. 1. Sample Data 먼저 필요한 라이브러리들을 불러오고,12345678%matplotlib inlineimport numpy as npimport pand

Lecture Survey Summary (Google Forms)

2주 전 학회에서 머신러닝 기초 강의를 했습니다. Google Forms를 통해서 참석자들에게 피드백을 받았습니다. 답변 정리에 Matplotlib 함수를 적극적으로 사용했습니다. 1. Google Forms Google Forms는 간단하게 설문조사를 할 수 있는 플랫폼입니다. 회의나 회식 일정을 잡는데 사용하기도 편하고 피드백을 받기 좋습니다.

데이터 시각화 가이드 - 제발 이렇게 그리지 마세요

제 직장의 AI 학습조직 발표 영상입니다. 시간관계상 실시간 발표 대신 온라인 영상 공유로 대신합니다. 더 좋은 그림이 있음에도 안좋은 그림을 그리곤 합니다. 몰라서, 생각을 안해봐서, 코딩에 대한 두려움이 원인일 수 있습니다. 강의자료: pdf 내려받기