tanuki- 2018-03-25 halfkp_128x2-32-32 elmo絞り
- 棋譜生成
- tanuki-棋譜生成ルーチン
- depth 8
- 開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
- 50億局面生成
- 対局は打ち切らず詰みの局面まで学習データに出力する
- 評価関数はApery SDT5
- シャフル
- あり
- 機械学習
- NNUE機械学習ルーチン v0.3
- ネットワーク halfkp_128x2-32-32
- 学習手法 SGD ミニバッチ法
- batchsize 1000000
- lambda 0.5
- eta 0.1
- newbob_decay 0.5
- nn_batch_size 1000
- eval_save_interval 100000000
- loss_output_interval 1000000
- mirror_percentage 50
- eval_limit 3000
- https://docs.google.com/document/d/1brJUf5qig89nVF8hOWI8XmDzR-wHYU4DVofwEWozLyo/edit?usp=sharing からの追加学習
実験結果
13:14:00 engine1=nnue\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\zoukin2.2018-03-12.lambda.0.50\final13:14:00 engine2=hakubishin-private\build\2017Early\YaneuraOu-2017-early.exe eval2=F:\hnoda\hakubishin\exe\eval\apery_sdt5_eval_twig_format13:14:00 T1,b5000,451 - 67 - 482(48.34% R-11.55) win black: white = 50.80% : 49.20% declaration win engine1=27 engine2=0