Category: Data Science

데이터 분할과 교차 검증

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터를 class 비율대로 분류하는 stratified K fold를 소개하고, 모든 데이터를 학습과 검증에 활용하는 cross validation을 다룹니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상 : (Y

seaborn regplot vs lmplot

seaborn에는 regplot이라는 기능이 있습니다. 산점도, 회귀선, 신뢰 구간을 동시에 표현해주는 강력한 기능입니다. 그리고 같은 결과를 출력하는 lmplot이 있습니다. 같은 점과 다른 점을 확인합니다. 1. seaborn regplot seaborn.regplot seaborn에는 regplot 함수가 있습니다. scatter plot, r

short discussions on KDE plot

경향신문과 언더스코어가 공동으로 조사한 ‘부모찬스’기사가 실렸습니다. 기사 내용과 별개로, 이 기사에 활용된 KDE plot에 대해 여러 분들이 여러 의견을 표했습니다. KDE plot의 특징과 한계를 살펴봅니다. 언더스코어경향신문: 두 얼굴의 공정(1) 조국과 정호영, 누가 더 ‘불공정’합니까?경향신문: 정치 성향에 따라 부모찬스에 들이댄 ‘공정 잣

머신 러닝 파이프라인

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. scikit-learn 기능 중 데이터 전처리와 머신 러닝을 안정적으로 수행할 수 있는 파이프라인을 소개합니다. one-hot encoding과 standard scaling도 그냥 하면 안 됩니다. train set으로 학습해서 test set에 적용해야 합니다

머신 러닝 기본 개념

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝 진도를 나가기로 했습니다. scikit-learn을 중심으로 머신러닝 실습을 할 예정입니다. 코드를 만지기 전 기본 개념을 전달드리는 강의를 진행했습니다. 강의 자료는 여기에서 다운받으실 수 있습니다 발표 영상입니다 (Youtube Link) 바쁜 연구원 일정 속에 변동

reliability of Covid-19 self test kit

코로나-19 자가진단키트에서 두 줄이 떴습니다. 올 게 왔나 싶으면서도, 이거 얼마나 믿을만한지 몹시 궁금했습니다. 선별진료소 결과를 기다리며 분류 기초를 복습합니다. 1. 사건의 발단 식품의약품안전처: 자가진단키트 양성예측도 76%경향신문: 자가검사키트, 민감도 특이도는 뭐고 양성예측도는 또 뭔가요? 3일 전, 안녕하시냐고 묻는 안녕하지 못한 내

ridge-map

지형을 중첩된 line plot으로 그리는 ridgemap 라이브러리를 소개합니다. Matplotlib 생태계의 일원으로 쉽게 사용할 수 있습니다. 소스 코드를 조금 고쳐줄 필요가 있습니다. 1. ridge-map pypi: ridge-map/ 설명 대신 그림을 한 장 보여드리겠습니다. 아름다운 산악 지형의 풍경이 고전적인 느낌으로 그려져 있습

AI를 하고 싶은 C-level의 흔한 실수들

연구개발특구(innopolis)에서 CEO 대상 AI 인사이트 교육 발표를 했습니다. (22.03.24.) 공지된 제목은 데이터, 다이아몬드 또는 진흙이었습니다만 제 앞에서 발표하신 고우영 님의 발표를 보고 연장선상에서 바꿨습니다. 수정된 제목은 AI를 하고 싶은 C-level의 흔한 실수들입니다. 발표 영상입니다 (Youtube Link)

joinstyle & capstyle

오늘은 매우 사소한 글입니다. Matplotlib에서 그려지는 선의 꼭지점과 끝점 표현입니다. 사소하지만 신경을 거스르는 일을 해결합시다. 1. motivation: Pie chart 다른 그림에 비해 자주 그리는 그림은 아닙니다. 그런 만큼 손에 익히기 쉽지 않은데, 정리를 한번 하겠습니다. 아보카도, 바나나, 체리 판매량이 각기 40, 70, 1

colorsys - Conversions between Color Systems

이미지를 처리하는 파이썬 라이브러리는 많습니다. 가장 잘 알려진 opencv와 pillow를 비롯해서 matplotlib도 이미지 처리를 합니다. colorsys라는 파이썬 기본 라이브러리가 있습니다. 색 공간을 변환하는 라이브러리인데, 이것만 잘 써도 할 수 있는 게 많습니다. 1. 예제 이미지 wikimedia commons: Siberischer