Category: Data Science

Scipy 소개 + curve fitting

SciPy 한국에너지기술연구원 AI 학습조직에서는 2023년 한 해동안 데이터 처리를 공부합니다. 첫 시간으로 SciPy를 소개합니다. SciPy는 미분방정식을 풀고, 적분을 해주고, 최적해를 찾아주는 막강한 기능을 가지고 있습니다. 그러나 Numpy에 비해 덜 필수적이고 - Numpy는 데이터를 다룰 때 필수니까요 SciPy가 막강한 힘을 발휘하는

번역 모델 비교 - 성능, 시간, 요금

딥러닝의 빠른 발전으로 기계번역이 매우 쉬워졌습니다. 다양한 모델을 선택할 수 있고, 구독 모델도 여럿 나와있습니다. 현명한 소비자가 되기 위해 모델들의 번역 성능을 비교합니다. 1. 번역 성능 평가 BLEU: a method for automatic evaluation of machine translation유원준, 안상준, “딥 러닝을 이용한 자연어

KDE + threshold

밀도 함수는 데이터 분포를 볼 때 가장 많이 그리는 그림 중 하나입니다. 특정 값을 기준으로 Pass와 Fail을 정한다고 할 때, 전체의 비율도 중요합니다. seaborn kdeplot을 살짝 다듬어서 쪼개고 비율을 계산합니다. 1. 오늘의 목표 오늘 우리는 데이터를 선별하는 데 쓰는, 이런 그림을 그릴 겁니다. 특정 값을 기준으로 왼쪽은 Fail,

연구소의 문헌분석 기술 활용

2022년 12월 13일 모두의 연구소 초청으로 MODUPOP 강연을 했습니다. 몸담고 있는 연구원에서 적용하고 있는 문헌분석 기술을 공유드렸습니다. 짧은 시간에 압축해서 전달드린터라 세부 기술보다는 적용처 중심으로 봐주시면 감사하겠습니다. 저녁 7시부터 시작된 강의였고, 비와 눈으로 날씨가 많이 나쁜 날이었습니다. 귀중한 시간을 내서 온라인, 오프라인

Impact of RPA

RPA(Robotic Process Automation: 업무 자동화) 과제를 하려고 합니다. RPA를 적용하면 효용이 얼마나 좋은지를 설득하기 위한 그림을 그립니다. RPA 도입 전과 후를 비교하는 그림을 그려서 보여줍시다. 1. 행정 업무 어떤 가상의 데이터 관련 행정 업무가 있다고 합시다. 현재는 총 2천만원의 용역비를 포함해 12주가 걸립니다

Deep Learning by Open API

한국에너지기술연구원 AI 학습조직에서는 2022년 한 해동안 머신러닝을 공부하고 있습니다. 이번에는 직접 하는 코딩을 벗어나 공개된 딥러닝 모델을 사용하는 방법을 알아봅니다. 영상과 자연어 처리를 중심으로 OpenAI에서 제공하는 여러 모델이 있습니다. 강의실 예약 시간 문제로 마무리가 매끄럽지 못했습니다. 요약본이 번역되다 만 문제는 max_tokens

Gaussian Process Practice (3) Beware Boundaries

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 주의사항을 알려드립니다. Gaussian Process는 경계조건에 매우 취약합니다. 1. Gaussian Process의 한계 scikit-learn: Gaussian Process Regression: basic introductory examp

Gaussian Process Practice (2) Kernels

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 여러 커널의 특징을 알아보고 사용처를 알아봅니다. 1. Data Preparation scikit-learn: Gaussian Process Regression: basic introductory example 1.1. example data 지난

Gaussian Process Practice (1) 1D

Gaussian Process 연습입니다. scikit-learn을 비롯한 예제를 재구성하여 연습합니다. 오차가 없을 때와 있을 때를 비교합니다. 1. Data Preparation scikit-learn: Gaussian Process Regression: basic introductory example 1.1. example data Gaussia