Words Co-occurence in Academic Literatures
1. 요약1.1. 포부 논문을 긁어서 내용을 정리할 수 있음을 이전 글에서 간략히 언급했습니다. 짧은 시간동안 필요한 결론을 도출할 수 있었고 피보고자의 반응도 좋았습니다. Notepad++에서 시간에 쫓기며 find(Ctrl+F), replace(Ctrl+H)를 반복하며 작업했기에 기록도 없었습니다. 다음에도 이 강력한 기능의 재현 가능성을 확보하고자 했
1. 요약1.1. 포부 논문을 긁어서 내용을 정리할 수 있음을 이전 글에서 간략히 언급했습니다. 짧은 시간동안 필요한 결론을 도출할 수 있었고 피보고자의 반응도 좋았습니다. Notepad++에서 시간에 쫓기며 find(Ctrl+F), replace(Ctrl+H)를 반복하며 작업했기에 기록도 없었습니다. 다음에도 이 강력한 기능의 재현 가능성을 확보하고자 했
wikipedia: Bresenham’s line algorithmwikipedia: Xiaolin Wu’s line algorithmflags’s github 연속된 공간에 있는 두 점과 그 사이에 정의된 선분은 어려운 주제는 아닙니다. 그러나 이 점들을 비트맵 이미지처럼 유한한 수의 점으로 표현해야 한다면 적절한 위치에 근사하는 것은 아주 귀찮은
Contributor 김승욱님, dane님 References wikipedia: Stratified SamplingWhen should you choose Stratified sampling over random sampling?핸즈온 머신러닝 (2판)핸즈온 머신러닝 (2판): 2장 - 머신러닝 프로젝트 처음부터 끝까지 notebook 1. Int
matplotlib.axes.Axes.set_xlimnumpy.histogram 그래프에서 중요한 값들이 특정 범위에 몰려있으면 확대를 해야 합니다. matplotlib의 object oriented API는 .set_xlim()과 .set_ylim()을 제공해 줍니다. jupyter notebook에서 %matplotlib qt로 선언했다면 GUI로
데이터 분석에 앞서 잘못된 부분을 찾아내고 이를 메꾸는 작업을 데이터 정리(data cleansing)이라고 합니다. 개별 데이터의 타입(type), 크기(length) 등이 잘못된 경우도 있고, 개별 데이터는 정상적이지만 이것들을 합쳤더니(merge) 결측치가 양산되거나 중복되는 경우도 있습니다. 분석이나 예측모델 생성시 문제의 원인이 되기 때문에 처음
원문: by Aurélien Geron (Link) Translated by Chansung PARK (Link) Object Oriented API Addition by Jehyun LEE (Link) Tools - matplotlib 이 노트북은 matplotlib 라이브러리를 사용하여 아름다운 그래프를 그리는 방법을 보여줍니다. 이제현
References Google Maps네이버 지도 지리데이터를 분석하다 보면 웹기반 지도서비스가 필요할 때가 있습니다. API를 사용해서 notebook 상에서 띄워볼 수도 있지만 전체 기능이 필요하기도 합니다. 이럴 때는 웹브라우저를 켜고 구글 지도나 네이버 지도를 들어가 검색을 합니다. 주소를 알면 간단하겠지만 위경도 좌표밖에 모른다면 많이
Matplotlib은 자유도가 높은 만큼 건드릴 곳이 많아서 익숙해지기가 영 만만치 않습니다. 저도 이 바람에 Matplotlib을 버릴까 했으나 Matplotlib에 의존하는 라이브러리가 너무 많더군요. 피할 수 없다면, 헷갈리지 않게 그리는 방법을 익혀봅시다.1234import matplotlib.pyplot as pltimport matplotlib
wikipedia: Pearson Correlation Coefficient선형대수, 통계학, 기하적 직관 Pearson Correlation Coefficient는 두 데이터가 얼마나 연관성을 가지고 있는지 보여줍니다. 수치로는 -1에서 1 사이의 값으로 표현되고, 수식으로는 다음과 같이 표현됩니다.$$ \rho_{X, Y} = \frac{Cov
물을 끓이는 등 상태가 변할 때, 에너지가 흡수되어 온도가 일정하게 유지됩니다. 위와 같은 그래프에서 평평한 영역을 찾고, 각 구간의 대표점을 추출하겠습니다. 데이터 추출과 시각화 과정에서 사용되는 기법은 다음과 같습니다. Noise Reduction scipy.ndimage: signal averaging, median np.hanning, n