[2nd DLCAT] 카드게임 강화학습 환경 개발기 - 하스스톤

2016년, 딥마인드에서 개발한 인공지능 바둑 프로그램인 ‘알파고’는 전세계에 커다란 충격을 안겨주었습니다. 최근에는 스타크래프트2 AI ‘알파스타’를 통해 프로게이머에게 10 대 1로 압승해 또 한 번 세계를 놀라게 했습니다. 이를 통해 강화학습에 관심을 갖게 되어 어떤 게임에 적용해볼까 고민하다가 평소 즐기던 ‘하스스톤’이라는 게임에 관심을 갖게 되어 2017년 말부터 하스스톤 강화학습을 위한 API를 만들기 시작했습니다. 이 세션에서는 하스스톤이라는 게임을 간단하게 설명하고 기존 게임과 어떤 부분이 다른지 살펴봅니다. 그리고 현재까지 하스스톤 강화학습과 관련해 진행되었던 연구들을 살펴보고 어떤 한계점을 갖고 있는지 설명합니다. 다음으로 약 1년 반 동안 하스스톤을 만들면서 어떤 기술들을 적용했는지, 그리고 개발하는 과정에서 어떤 어려움을 겪었고 해결했는지 이야기합니다. 마지막으로 강화학습을 위한 환경을 구축하기 위해 작업했던 내용들을 설명하고 완성된 학습 환경을 통해 AI를 어떻게 학습할 수 있는지 살펴봅니다. 이 발표를 통해 평소 하스스톤과 같은 카드 게임 개발이나 게임에 강화학습을 적용하기 위한 환경을 구축하는데 관심을 갖고 있던 프로그래머들에게 조금이나마 도움이 되었으면 합니다.

연사소개

현재 넥슨 코리아에서 게임 클라이언트 개발을 담당하고 있습니다. C++와 게임 개발, 컴퓨터 그래픽스, 강화학습, 오픈 소스에 관심이 많습니다. 페이스북 C++ Korea 그룹을 운영하며 스터디 활동과 함께 다양한 책을 번역/집필 중이며, 남는 시간엔 학생들과 함께 다양한 오픈 소스 프로젝트를 진행하며 보다 나은 미래를 만들기 위해 노력하고 있습니다. 옮긴 책으로는 『게임샐러드로 코드 한 줄 없이 게임 만들기』 (에이콘출판사, 2013), 『유니티 Shader와 Effect 제작』 (에이콘출판사, 2014), 『2D 게임 프로그래밍』 (에이콘출판사, 2014), 『러스트 핵심 노트』 (한빛미디어, 2017), 『모던 C++ 입문』 (길벗, 2017), 『C++ 최적화』 (한빛미디어, 2019)이 있습니다.

블로그: https://utilforever.github.io
Github: https://github.com/utilforever
이메일: utilForever@gmail.com

발표자료

다운로드

참고자료

TBD

장소 및 시간

장소: 대전광역시 유성구 가정로 217 UST 과학기술연합대학원대학교, UST 강당
시간: 7월 4일 16시

시간	A-USTaudi	B-USTsci	C-USTmeet	D-ETRI212	E-ETRI224	F-ETRI219
10시	조수현 3분 강화학습 순한맛 SAC	이수진 AI시대의 예술작품 - AI Atelier를 이용하여	박해선 케라스 in 텐서플로우2.0	유용균 딥러닝과 최적설계	이현호 (실습)유니티 기반 드론 강화학습 (1)	정연준 아기다리고기다리던딥러닝 - 케라스로 띄어쓰기 정복하기 (1)
11시	안수빈 The Newbie Guide to Blogging & Visualization	김준태 나도 너도 모르는 Graph Neural Network의 힘	안종훈 설명가능한 AI for AI 윤리	이유한 I’m Kaggler - Why need kaggle?	이현호 (실습)유니티 기반 드론 강화학습 (2)	정연준 아기다리고기다리던딥러닝 - 케라스로 띄어쓰기 정복하기 (2)
13시	남기현 (이론)딥러닝으로 오디오 만나보기	김유민 딥러닝 모델 엑기스 추출(Knowlege Distillation)	홍원의 (실습)한페이지 논문잡기:찾고+읽고+쓰고+정리하기	서정훈 빽 투 더 Representation Learning: Visual Self-supervision을 중심으로	신경인 (실습)파이토치로 갈아타기 (1)	전미정 (실습)MS Azure ML Service와 함께하는 AutoML 사용하기(1)
14시	황준원 (실습)딥러닝으로 오디오 만나보기	김영하 AutomatedML 동향	홍원의 (실습)한페이지 논문잡기:찾고+읽고+쓰고+정리하기	송규예 Deeplema, 딥러닝 서비스상용화의 딜레마	신경인 (실습)파이토치로 갈아타기 (2)	전미정 (실습)MS Azure ML Service와 함께하는 AutoML 사용하기 (2)
15시	민규식 강화학습 환경 제작, Unity ML-agents와 함께하세요	김태진 구글 코랩 TPU 알아보기	김보섭 Structuring your first NLP project (1)	이진원 Efficient CNN 톺아보기	김경환,박진우 (실습)Rainbow로 달착륙부터 Atari까지 (1)	대전AI거버넌스 AI 거버넌스 구성
16시	옥찬호 카드게임 강화학습 환경 개발기 - 하스스톤	김형섭 GAN 동향	김보섭 Structuring your first NLP project (2)	차금강 설명가능한 강화학습	김경환,박진우 (실습)Rainbow로 달착륙부터 Atari까지 (2)	대전AI거버넌스 AI 적용 가속화 방안
17시	김태영 이제	김태영 하이퍼파라미터	김태영 튜닝은	김태영 케라스 튜너에게	김태영 맡기세요	대전AI거버넌스 한계 및 목표치 설정

점심시간은 12시 ~ 13시입니다.
각 세션은 45분 발표, 5분 질의응답, 10분 휴식 및 이동입니다.
UST과 ETRI사이는 도보로 10분이내 거리에 있습니다. 따라서 쉬는 시간을 이용해서 이동하시면 됩니다.

상세 프로그램 보기

참가신청

신청은 아래 링크에서 해주세요~

» 신청하기 «

딥러닝을 시작하는 이유는 달라도 딥러닝을 계속 하는 이유 중 하나는 바로 ‘함께하는 즐거움’이지 않을까합니다. 작년 6월 말 대전에서 “1st 함께하는 딥러닝 컨퍼런스”에 400명 넘게 모여 즐겁게 인공지능 및 딥러닝 관한 다양한 주제로 톡을 나누었습니다. 그간 매일 논문만 읽어도 못 따라갈 만큼 새로운 연구가 쏟아지고 있고, 그 활용 사례 및 관심 또한 각 분야에 퍼져가고 있습니다. 대전은 전국 각지에서 오시기에 접근성이 용이하고, 정부출연연구원 및 정부청사, 우수한 대학교, 대기업의 기술 연구소, 최첨단 기술 중심의 벤처회사들이 밀집된 지역인 만큼 지식공유의 즐거움을 나누고자 합니다.

별도의 참가비는 없습니다. 연사분들도 여러분과 즐기게 위해 재능기부합니다. 주차공간이 협소하므로 대중교통을 이용해주세요.

일시: 2019년 7월 4일 (10시~18시)
장소: 대전광역시 유성구 가정로 217
- 과학기술연합대학원대학교 - 대전광역시 유성구 가정로 217
- ETRI 융합기술연구생산센터 - 대전광역시 유성구 가정로 218
주최: (주)인스페이스 - (주)인스페이스는 한국항공우주연구원 출신 연구원들이 시작한 벤처회사로 위성지상국 개발 및 활용 전문 기술을 기반으로 사업 영역을 확장하고 있습니다. 현재 “태양에서 세포까지 딥러닝”, “게임에서 우주까지 강화학습”의 모토로 여러분야 인공지능을 적용하고자 활발히 연구 개발 중입니다. 인공지능은 기술을 넘어 산업체, 학계, 정부출연연과 오픈 커뮤니티의 공동상생할 수 있는 생태계를 만들고 있기 때문에 인스페이스는 대전을 중심으로 인공지능 생태계를 위한 소통의 장을 형성하기 위해 노력하고 있으며 확대할 계획입니다.
주관: 대딥사, 케라스 코리아, 캐글 코리아, RL 코리아
후원:
- UST 과학기술연합대학원대학교
- ETRI 융합기술연구생산센터
- 대전정보문화산업진흥원
- (주)유클리드소프트 - 유클리드소프트는 정부부처 및 공공기관 서비스 개발과정에서 축적한 솔루션 기반 탄탄한 기술력 위에 빅데이터 분석, AI기반 CCTV 행동 패턴 분석, CNN, RNN, GAN 등 최신 기술을 접목하여, 고객의 핵심 가치에 더 나은 핵 가치를 제공하고자 계속 노력하고 있는 덕후 개발자들의 회사입니다.
대상: 인공지능 및 딥러닝에 관심있거나 관련 연구를 수행하시는 분들 (약 700명)
- 트랙 A: UST 강당 300명
- 트랙 B: UST 사이언스홀 65명
- 트랙 C: UST 대회의실 35명
- 트랙 D: ETRI 융합기술연구생산센터 212호 대회의실 180명
- 트랙 E: ETRI 융합기술연구생산센터 224호 중회의실 50명
- 트랙 F: ETRI 융합기술연구생산센터 219호 중회의실3 20명

[2nd DLCAT] 카드게임 강화학습 환경 개발기 - 하스스톤 - 옥찬호