tanuki- 2017-12-04 Apery式elmo絞り
- 棋譜生成
- 評価関数
- sdt5 評価関数
- 開始局面
- 2chkifuおよびfloodgateの全局面からランダムに選択
- 選択した局面の合法手からランダムに1手指した局面を開始局面とする
- 探索深さ 8
- 自己対戦は途中で打ち切らず詰みの局面まで学習データに含める
- 入玉宣言勝ちも学習データに含める
- 生成局面数 60億
- 機械学習
- 学習手法 Adam ミニバッチ法
- 学習率 0.5
- ミニバッチサイズ 100万
- 元の評価関数 sdt5
- 検証データは100万局面生成したものをそのまま使っている
- 学習データ 60億局面
- 学習局面数 60億局面
実験結果
16:39:25 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-02-07-45-45 16:39:25 engine2=YaneuraOu-2017-early.exe eval2=eval\tanuki-.2017-11-04-03-42-31.1-1 16:39:25 T1,b5000,483 - 44 - 473(50.52% R3.63) win black: white = 50.84% : 49.16% declaration win engine1=0 engine2=0
00:22:49 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-02-07-45-45 00:22:49 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format 00:22:49 T1,b5000,419 - 32 - 549(43.29% R-46.94) win black: white = 50.72% : 49.28% declaration win engine1=0 engine2=0