시계열 데이터 예측 애저 오토엠엘(Azure AutoML)
기상, 금융, 에너지 등등 시간에 따라 변하는 데이터를 다루고 있는 분야가 많습니다. 이를 시계열 데이터라고 부르고, 이러한 데이터를 입력하여, 분류를 하거나 이상징후를 검출하거나 미래의 수치를 예측하기도 합니다. 이번 발표에서는 시계열 예측 문제로 과거의 정보를 입력하여 미래의 요소를 예측하는 방법 중 AutoML에 대해서 말씀드리고자 합니다. AutoML은 머신러닝 모델을 인공지능이 데이터셋을 보면서 스스로 전처리 및 모델링을 수행하는 것을 말합니다. 시계열 데이터 분석 및 예측에서는 전통적인 통계 방법, 머신러닝 모델, 딥러닝 모델 등 많은 연구가 이뤄지고 있는데요, 마이크로소프트 애저 오토엠엘(Azure AutoML)에서도 시계열 예측 문제를 지원하게 되어 이를 소개드립니다.
발표영상
본 발표는 2020년 4월 25일 Global Azure Virtual 2020 온라인 행사에서 진행되었습니다.
발표자료
발표 슬라이드는 아래 링크에서 확인할 수 있습니다.
내용요약
전체 중 일부 슬라이드에 대해서 요약해봤습니다.
현재 애저 오토엠엘에서 지원하는 태스크는 분류, 회귀, 시계열 예측 문제입니다. 이번 발표에서는 시계열 예측에 대해서 다룹니다.
애저 오토엠엘은 작동원리를 그림으로 표시한 것입니다. 사용자는 데이터셋, 평가기준, 자원제약사항만 입력하면 피처 엔지니어링, 모델링, 하이퍼파라미터 튜닝 등은 오토엠엘에서 알아서 수행하고, 평가 결과를 리더보드(점수판)에 기록합니다.
각 태스크별로 지원되는 메트릭을 표시한 것 입니다. AutoML은 지정된 메트릭에 최고의 성능을 내는 모델을 만드는 것이 목표이므로 적절한 메트릭을 지정하는 것이 중요합니다.
시계열 예측 문제에 대한 교차 검증 방법으로 Rolling Origin 방식이 있습니다. 타입스텝이 진행됨에 따라 새로생긴 샘플로 검증을 수행합니다.
오토엠엘에서 가장 신경써야 하는 부분은 AutoMLConfig입니다. 시계열 예측 문제에서는 아래와 같은 추가 파라미터가 필요합니다.
- time_column_name : 시간스텝을 의미하는 열을 지정합니다.
- grain_column_name : 복수 개의 시계열이 존재할 경우 그룹핑할 열을 지정합니다.
- max_horizon : 최대 예측 구간을 지정합니다.
실제 예제 파이썬 코드를 살펴보면서 데이터 준비, 환경 설정, 오토엠엘 설정, 실행, 평가 결과 보는 법에 대해서 설명합니다.
둘러보기
Global Azure Virtual 2020
이번 행사에는 4개 트랙으로 마이크로소프트 애저 클라우드(Microsoft Azure Cloud)와 관련된 다양하고 재미있고 흥미진진한 기술 세미나가 열렸습니다.
- 트랙 A: DevOps
- 트랙 B: 보안
- 트랙 C: AI & IoT
- 트랙 D: 모던 앱스
아래 링크로 꼭 한 번 둘러보시기 바랍니다~
AIFactory
케라스 코리아 커뮤니티
캐글 코리아 커뮤니티
MLOps KR 커뮤니티
책 소개
[추천사]
- 하용호님, 카카오 데이터사이언티스트 - 뜬구름같은 딥러닝 이론을 블록이라는 손에 잡히는 실체로 만져가며 알 수 있게 하고, 구현의 어려움은 케라스라는 시를 읽듯이 읽어내려 갈 수 있는 라이브러리로 풀어준다.
- 이부일님, (주)인사아트마이닝 대표 - 여행에서도 좋은 가이드가 있으면 여행지에 대한 깊은 이해로 여행이 풍성해지듯이 이 책은 딥러닝이라는 분야를 여행할 사람들에 가장 훌륭한 가이드가 되리라고 자부할 수 있다. 이 책을 통하여 딥러닝에 대해 보지 못했던 것들이 보이고, 듣지 못했던 것들이 들리고, 말하지 못했던 것들이 말해지는 경험을 하게 될 것이다.
- 이활석님, 네이버 클로바팀 - 레고 블럭에 비유하여 누구나 이해할 수 있게 쉽게 설명해 놓은 이 책은 딥러닝의 입문 도서로서 제 역할을 다 하리라 믿습니다.
- 김진중님, 야놀자 Head of STL - 복잡했던 머릿속이 맑고 깨끗해지는 효과가 있습니다.
- 이태영님, 신한은행 디지털 전략부 AI LAB - 기존의 텐서플로우를 활용했던 분들에게 바라볼 수 있는 관점의 전환점을 줄 수 있는 Mild Stone과 같은 책이다.
- 전태균님, 쎄트렉아이 - 케라스의 특징인 단순함, 확장성, 재사용성을 눈으로 쉽게 보여주기 위해 친절하게 정리된 내용이라 생각합니다.
- 유재준님, 카이스트 - 바로 적용해보고 싶지만 어디부터 시작할지 모를 때 최선의 선택입니다.