[2nd DLCAT] 카드게임 강화학습 환경 개발기 - 하스스톤 - 옥찬호
2016년, 딥마인드에서 개발한 인공지능 바둑 프로그램인 ‘알파고’는 전세계에 커다란 충격을 안겨주었습니다. 최근에는 스타크래프트2 AI ‘알파스타’를 통해 프로게이머에게 10 대 1로 압승해 또 한 번 세계를 놀라게 했습니다. 이를 통해 강화학습에 관심을 갖게 되어 어떤 게임에 적용해볼까 고민하다가 평소 즐기던 ‘하스스톤’이라는 게임에 관심을 갖게 되어 2017년 말부터 하스스톤 강화학습을 위한 API를 만들기 시작했습니다. 이 세션에서는 하스스톤이라는 게임을 간단하게 설명하고 기존 게임과 어떤 부분이 다른지 살펴봅니다. 그리고 현재까지 하스스톤 강화학습과 관련해 진행되었던 연구들을 살펴보고 어떤 한계점을 갖고 있는지 설명합니다. 다음으로 약 1년 반 동안 하스스톤을 만들면서 어떤 기술들을 적용했는지, 그리고 개발하는 과정에서 어떤 어려움을 겪었고 해결했는지 이야기합니다. 마지막으로 강화학습을 위한 환경을 구축하기 위해 작업했던 내용들을 설명하고 완성된 학습 환경을 통해 AI를 어떻게 학습할 수 있는지 살펴봅니다. 이 발표를 통해 평소 하스스톤과 같은 카드 게임 개발이나 게임에 강화학습을 적용하기 위한 환경을 구축하는데 관심을 갖고 있던 프로그래머들에게 조금이나마 도움이 되었으면 합니다.
연사소개
현재 넥슨 코리아에서 게임 클라이언트 개발을 담당하고 있습니다. C++와 게임 개발, 컴퓨터 그래픽스, 강화학습, 오픈 소스에 관심이 많습니다. 페이스북 C++ Korea 그룹을 운영하며 스터디 활동과 함께 다양한 책을 번역/집필 중이며, 남는 시간엔 학생들과 함께 다양한 오픈 소스 프로젝트를 진행하며 보다 나은 미래를 만들기 위해 노력하고 있습니다. 옮긴 책으로는 『게임샐러드로 코드 한 줄 없이 게임 만들기』 (에이콘출판사, 2013), 『유니티 Shader와 Effect 제작』 (에이콘출판사, 2014), 『2D 게임 프로그래밍』 (에이콘출판사, 2014), 『러스트 핵심 노트』 (한빛미디어, 2017), 『모던 C++ 입문』 (길벗, 2017), 『C++ 최적화』 (한빛미디어, 2019)이 있습니다.
- 블로그: https://utilforever.github.io
- Github: https://github.com/utilforever
- 이메일: utilForever@gmail.com
발표자료
참고자료
TBD
장소 및 시간
- 장소: 대전광역시 유성구 가정로 217 UST 과학기술연합대학원대학교, UST 강당
- 시간: 7월 4일 16시
시간 | A-USTaudi | B-USTsci | C-USTmeet | D-ETRI212 | E-ETRI224 | F-ETRI219 |
---|---|---|---|---|---|---|
10시 | 조수현 3분 강화학습 순한맛 SAC |
이수진 AI시대의 예술작품 - AI Atelier를 이용하여 |
박해선 케라스 in 텐서플로우2.0 |
유용균 딥러닝과 최적설계 |
이현호 (실습)유니티 기반 드론 강화학습 (1) |
정연준 아기다리고기다리던딥러닝 - 케라스로 띄어쓰기 정복하기 (1) |
11시 | 안수빈 The Newbie Guide to Blogging & Visualization |
김준태 나도 너도 모르는 Graph Neural Network의 힘 |
안종훈 설명가능한 AI for AI 윤리 |
이유한 I’m Kaggler - Why need kaggle? |
이현호 (실습)유니티 기반 드론 강화학습 (2) |
정연준 아기다리고기다리던딥러닝 - 케라스로 띄어쓰기 정복하기 (2) |
13시 | 남기현 (이론)딥러닝으로 오디오 만나보기 |
김유민 딥러닝 모델 엑기스 추출(Knowlege Distillation) |
홍원의 (실습)한페이지 논문잡기:찾고+읽고+쓰고+정리하기 |
서정훈 빽 투 더 Representation Learning: Visual Self-supervision을 중심으로 |
신경인 (실습)파이토치로 갈아타기 (1) |
전미정 (실습)MS Azure ML Service와 함께하는 AutoML 사용하기(1) |
14시 | 황준원 (실습)딥러닝으로 오디오 만나보기 |
김영하 AutomatedML 동향 |
홍원의 (실습)한페이지 논문잡기:찾고+읽고+쓰고+정리하기 |
송규예 Deeplema, 딥러닝 서비스상용화의 딜레마 |
신경인 (실습)파이토치로 갈아타기 (2) |
전미정 (실습)MS Azure ML Service와 함께하는 AutoML 사용하기 (2) |
15시 | 민규식 강화학습 환경 제작, Unity ML-agents와 함께하세요 |
김태진 구글 코랩 TPU 알아보기 |
김보섭 Structuring your first NLP project (1) |
이진원 Efficient CNN 톺아보기 |
김경환,박진우 (실습)Rainbow로 달착륙부터 Atari까지 (1) |
대전AI거버넌스 AI 거버넌스 구성 |
16시 | 옥찬호 카드게임 강화학습 환경 개발기 - 하스스톤 |
김형섭 GAN 동향 |
김보섭 Structuring your first NLP project (2) |
차금강 설명가능한 강화학습 |
김경환,박진우 (실습)Rainbow로 달착륙부터 Atari까지 (2) |
대전AI거버넌스 AI 적용 가속화 방안 |
17시 | 김태영 이제 |
김태영 하이퍼파라미터 |
김태영 튜닝은 |
김태영 케라스 튜너에게 |
김태영 맡기세요 |
대전AI거버넌스 한계 및 목표치 설정 |
- 점심시간은 12시 ~ 13시입니다.
- 각 세션은 45분 발표, 5분 질의응답, 10분 휴식 및 이동입니다.
- UST과 ETRI사이는 도보로 10분이내 거리에 있습니다. 따라서 쉬는 시간을 이용해서 이동하시면 됩니다.
참가신청
신청은 아래 링크에서 해주세요~
» 신청하기 «
딥러닝을 시작하는 이유는 달라도 딥러닝을 계속 하는 이유 중 하나는 바로 ‘함께하는 즐거움’이지 않을까합니다. 작년 6월 말 대전에서 “1st 함께하는 딥러닝 컨퍼런스”에 400명 넘게 모여 즐겁게 인공지능 및 딥러닝 관한 다양한 주제로 톡을 나누었습니다. 그간 매일 논문만 읽어도 못 따라갈 만큼 새로운 연구가 쏟아지고 있고, 그 활용 사례 및 관심 또한 각 분야에 퍼져가고 있습니다. 대전은 전국 각지에서 오시기에 접근성이 용이하고, 정부출연연구원 및 정부청사, 우수한 대학교, 대기업의 기술 연구소, 최첨단 기술 중심의 벤처회사들이 밀집된 지역인 만큼 지식공유의 즐거움을 나누고자 합니다.
별도의 참가비는 없습니다. 연사분들도 여러분과 즐기게 위해 재능기부합니다. 주차공간이 협소하므로 대중교통을 이용해주세요.
- 일시: 2019년 7월 4일 (10시~18시)
- 장소: 대전광역시 유성구 가정로 217
- 과학기술연합대학원대학교 - 대전광역시 유성구 가정로 217
- ETRI 융합기술연구생산센터 - 대전광역시 유성구 가정로 218
- 주최: (주)인스페이스 - (주)인스페이스는 한국항공우주연구원 출신 연구원들이 시작한 벤처회사로 위성지상국 개발 및 활용 전문 기술을 기반으로 사업 영역을 확장하고 있습니다. 현재 “태양에서 세포까지 딥러닝”, “게임에서 우주까지 강화학습”의 모토로 여러분야 인공지능을 적용하고자 활발히 연구 개발 중입니다. 인공지능은 기술을 넘어 산업체, 학계, 정부출연연과 오픈 커뮤니티의 공동상생할 수 있는 생태계를 만들고 있기 때문에 인스페이스는 대전을 중심으로 인공지능 생태계를 위한 소통의 장을 형성하기 위해 노력하고 있으며 확대할 계획입니다.
- 주관: 대딥사, 케라스 코리아, 캐글 코리아, RL 코리아
- 후원:
- UST 과학기술연합대학원대학교
- ETRI 융합기술연구생산센터
- 대전정보문화산업진흥원
- (주)유클리드소프트 - 유클리드소프트는 정부부처 및 공공기관 서비스 개발과정에서 축적한 솔루션 기반 탄탄한 기술력 위에 빅데이터 분석, AI기반 CCTV 행동 패턴 분석, CNN, RNN, GAN 등 최신 기술을 접목하여, 고객의 핵심 가치에 더 나은 핵 가치를 제공하고자 계속 노력하고 있는 덕후 개발자들의 회사입니다.
- 대상: 인공지능 및 딥러닝에 관심있거나 관련 연구를 수행하시는 분들 (약 700명)
- 트랙 A: UST 강당 300명
- 트랙 B: UST 사이언스홀 65명
- 트랙 C: UST 대회의실 35명
- 트랙 D: ETRI 융합기술연구생산센터 212호 대회의실 180명
- 트랙 E: ETRI 융합기술연구생산센터 224호 중회의실 50명
- 트랙 F: ETRI 융합기술연구생산센터 219호 중회의실3 20명
책 소개
[추천사]
- 하용호님, 카카오 데이터사이언티스트 - 뜬구름같은 딥러닝 이론을 블록이라는 손에 잡히는 실체로 만져가며 알 수 있게 하고, 구현의 어려움은 케라스라는 시를 읽듯이 읽어내려 갈 수 있는 라이브러리로 풀어준다.
- 이부일님, (주)인사아트마이닝 대표 - 여행에서도 좋은 가이드가 있으면 여행지에 대한 깊은 이해로 여행이 풍성해지듯이 이 책은 딥러닝이라는 분야를 여행할 사람들에 가장 훌륭한 가이드가 되리라고 자부할 수 있다. 이 책을 통하여 딥러닝에 대해 보지 못했던 것들이 보이고, 듣지 못했던 것들이 들리고, 말하지 못했던 것들이 말해지는 경험을 하게 될 것이다.
- 이활석님, 네이버 클로바팀 - 레고 블럭에 비유하여 누구나 이해할 수 있게 쉽게 설명해 놓은 이 책은 딥러닝의 입문 도서로서 제 역할을 다 하리라 믿습니다.
- 김진중님, 야놀자 Head of STL - 복잡했던 머릿속이 맑고 깨끗해지는 효과가 있습니다.
- 이태영님, 신한은행 디지털 전략부 AI LAB - 기존의 텐서플로우를 활용했던 분들에게 바라볼 수 있는 관점의 전환점을 줄 수 있는 Mild Stone과 같은 책이다.
- 전태균님, 쎄트렉아이 - 케라스의 특징인 단순함, 확장성, 재사용성을 눈으로 쉽게 보여주기 위해 친절하게 정리된 내용이라 생각합니다.
- 유재준님, 카이스트 - 바로 적용해보고 싶지만 어디부터 시작할지 모를 때 최선의 선택입니다.