Reinfrocement Learning
-
[KataGo 논문 Review] Accelerating Self-Play in GoMachine Learning/Reinforcement Learning 2022. 4. 28. 00:46
"Accelerating Self-Play in Go" 논문을 한국어로 정리한 포스트입니다. Accelerating Self-Play Learning in Go (2020) a.k.a. KataGo David J. Wu, Jane Street Group. [ 논문 ] [ code ] Abstract AlphaZero의 학습과정과 구조에 몇 가지 향상된 기법을 적용함으로써, Self-play learning을 통한 바둑 AI의 학습 속도를 향상 시켰다. 비교할만한 다른 방법들에 비해 50x 절감된 계산량을 달성하였다. AlphaZero와 그 복제 알고리즘인 ELF OpenGo와 Leela Zero처럼, KataGo는 오직 뉴럴 네트워크에 기반한 몬테 카를로 트리 탐색을 통한 자체 대결(neural-net-..