tanuki- 2017-12-04 Apery式elmo絞り

棋譜生成

評価関数

sdt5 評価関数

開始局面

2chkifuおよびfloodgateの全局面からランダムに選択
選択した局面の合法手からランダムに1手指した局面を開始局面とする

探索深さ 8
自己対戦は途中で打ち切らず詰みの局面まで学習データに含める
入玉宣言勝ちも学習データに含める
生成局面数 60億

機械学習

学習手法 Adam ミニバッチ法
学習率 0.5
ミニバッチサイズ 100万
元の評価関数 sdt5
検証データは100万局面生成したものをそのまま使っている
学習データ 60億局面
学習局面数 60億局面

実験結果

16:39:25 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-02-07-45-45 16:39:25 engine2=YaneuraOu-2017-early.exe eval2=eval\tanuki-.2017-11-04-03-42-31.1-1 16:39:25 T1,b5000,483 - 44 - 473(50.52% R3.63) win black: white = 50.84% : 49.16% declaration win engine1=0 engine2=0

00:22:49 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-02-07-45-45 00:22:49 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format 00:22:49 T1,b5000,419 - 32 - 549(43.29% R-46.94) win black: white = 50.72% : 49.28% declaration win engine1=0 engine2=0