tanuki- 2018-03-25 halfkp_128x2-32-32 elmo絞り

棋譜生成

tanuki-棋譜生成ルーチン

depth 8
開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
50億局面生成
対局は打ち切らず詰みの局面まで学習データに出力する
評価関数はApery SDT5

シャフル

あり

機械学習

NNUE機械学習ルーチン v0.3
ネットワーク halfkp_128x2-32-32
学習手法 SGD ミニバッチ法
batchsize 1000000
lambda 0.5
eta 0.1
newbob_decay 0.5
nn_batch_size 1000
eval_save_interval 100000000
loss_output_interval 1000000
mirror_percentage 50
eval_limit 3000
https://docs.google.com/document/d/1brJUf5qig89nVF8hOWI8XmDzR-wHYU4DVofwEWozLyo/edit?usp=sharing からの追加学習

実験結果

13:14:00 engine1=nnue\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\zoukin2.2018-03-12.lambda.0.50\final13:14:00 engine2=hakubishin-private\build\2017Early\YaneuraOu-2017-early.exe eval2=F:\hnoda\hakubishin\exe\eval\apery_sdt5_eval_twig_format13:14:00 T1,b5000,451 - 67 - 482(48.34% R-11.55) win black: white = 50.80% : 49.20% declaration win engine1=27 engine2=0