tanuki- 2017-12-17 Apery式elmo絞りL2正則化
- 棋譜生成
- 評価関数
- sdt5 評価関数
- 開始局面
- 2chkifuおよびfloodgateの全局面からランダムに選択
- 選択した局面の合法手からランダムに1手指した局面を開始局面とする
- 探索深さ 8
- 自己対戦は途中で打ち切らず詰みの局面まで学習データに含める
- 入玉宣言勝ちも学習データに含める
- 生成局面数 60億
- 機械学習
- 学習手法 Adam ミニバッチ法
- 学習率 0.5
- ミニバッチサイズ 100万
- 元の評価関数 sdt5
- 検証データは100万局面生成したものをそのまま使っている
- 学習データ 60億局面
- 学習局面数 60億局面
- L2正則化
実験結果
fobos_l2_parameter=0.99990
02:03:39 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-06-17-49-35
02:03:39 engine2=YaneuraOu-2017-early.exe eval2=eval\tanuki-.2017-11-04-03-42-31.1-1
02:03:39 T1,b5000,403 - 39 - 558(41.94% R-56.53) win black: white = 54.21% : 45.79% declaration win engine1=0 engine2=0
09:30:30 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-06-17-49-35
09:30:30 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format
09:30:30 T1,b5000,382 - 23 - 595(39.10% R-76.98) win black: white = 53.53% : 46.47% declaration win engine1=0 engine2=0
fobos_l2_parameter=0.99995
06:01:36 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-08-21-01-43
06:01:36 engine2=YaneuraOu-2017-early.exe eval2=eval\tanuki-.2017-11-04-03-42-31.1-1
06:01:36 T1,b5000,436 - 50 - 514(45.89% R-28.59) win black: white = 51.16% : 48.84% declaration win engine1=0 engine2=0
13:31:21 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-08-21-01-43
13:31:21 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format
13:31:21 T1,b5000,410 - 29 - 561(42.22% R-54.47) win black: white = 49.02% : 50.98% declaration win engine1=0 engine2=0
fobos_l2_parameter=0.99998
14:28:46 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-16-01-31-34
14:28:46 engine2=YaneuraOu-2017-early.exe eval2=eval\tanuki-.2017-11-04-03-42-31.1-1
14:28:46 T1,b5000,448 - 43 - 509(46.81% R-22.18) win black: white = 53.08% : 46.92% declaration win engine1=0 engine2=0
06:48:55 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-16-01-31-34
06:48:55 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format
06:48:55 T1,b5000,407 - 33 - 560(42.09% R-55.44) win black: white = 50.26% : 49.74% declaration win engine1=0 engine2=0