tanuki- 2017-08-14 実験結果 学習局面数 50億局面 apery_wcsc26から生成した 初手から6手ランダムに選択 探索深さ 6 自己対戦は評価値3000で打ち切る 機械学習 学習局面数 50億 学習率 0.5 学習手法 Adam ミニバッチ法 ミニバッチサイズ 100万 元の評価関数…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。