tanuki- 2018-11-29 halfkp_256x2-32-32 自己対戦探索ノード数
- 棋譜生成
- NNUE v1.0+tanuki-棋譜生成ルーチン
- depth 64
- 探索ノード数が50kを超えたら探索を終了する
- 開始局面はfoodgate上の棋譜の32手目までから1局面ランダムに選択し、ランダムに1手指した局面とする
- 3億局面生成
- 対局は打ち切らず詰みの局面まで学習データに出力する
- 評価関数はhalfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4
- 探索パラメーターをhyperopt+Gaussian Processで0.1秒思考に合わせて調整済み
- シャフル
- あり
- 機械学習
- NNUE機械学習ルーチン v1.0
- ネットワーク halfkp_256x2-32-32
- 学習手法 SGD ミニバッチ法
- batchsize 1000000
- lambda 0.4・0.5・0.6・0.7・0.8・0.9
- eta 0.01
- newbob_decay 0.5
- nn_batch_size 1000
- eval_save_interval 100000000
- loss_output_interval 1000000
- mirror_percentage 50
- eval_limit 32000
- レーティング測定
- 対局相手
- やねうら王 v4.83 TNK + halfkp-256x2-32-32 + halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4
- やねうら王 v4.83 TNK + halfkp-256x2-32-32 + halfkp_256x2-32-32.iteration=5
- 反復深化法のイテレーション終了時、またはFail-low/high時に探索ノード数が50kを超えている場合に、思考を終了した
- 思考ノード数: 300万
- 全対局数: 1000
- 同時対局数: 23
- ハッシュサイズ: 256
- 開始局面: やねうら王互換局面集24手目からランダムに選択
実験結果
ロス
レーティング測定結果
lambda=0.4
20:15:00 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact\final 20:15:00 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 20:15:00 対局数1000 先手勝ち497(54%) 後手勝ち409(45%) 引き分け94 20:15:00 engine1 20:15:00 勝ち471(51% R13.81) 先手勝ち254(28%) 後手勝ち217(23%) 20:15:00 宣言勝ち10 先手宣言勝ち7 後手宣言勝ち3 20:15:00 先手引き分け35 後手引き分け59 20:15:00 engine2 20:15:00 勝ち435(48%) 先手勝ち243(26%) 後手勝ち192(21%) 20:15:00 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 20:15:00 先手引き分け59 後手引き分け35
lambda=0.5
11:21:30 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.5\final 11:21:30 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 11:21:30 対局数1000 先手勝ち449(50%) 後手勝ち433(49%) 引き分け118 11:21:30 engine1 11:21:30 勝ち439(49% R-1.58) 先手勝ち224(25%) 後手勝ち215(24%) 11:21:30 宣言勝ち10 先手宣言勝ち3 後手宣言勝ち7 11:21:30 先手引き分け56 後手引き分け62 11:21:30 engine2 11:21:30 勝ち443(50%) 先手勝ち225(25%) 後手勝ち218(24%) 11:21:30 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 11:21:30 先手引き分け62 後手引き分け56
lambda=0.6
19:38:44 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.6\final 19:38:44 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 19:38:44 対局数1000 先手勝ち468(51%) 後手勝ち438(48%) 引き分け94 19:38:44 engine1 19:38:44 勝ち466(51% R9.97) 先手勝ち248(27%) 後手勝ち218(24%) 19:38:44 宣言勝ち7 先手宣言勝ち2 後手宣言勝ち5 19:38:44 先手引き分け56 後手引き分け38 19:38:44 engine2 19:38:44 勝ち440(48%) 先手勝ち220(24%) 後手勝ち220(24%) 19:38:44 宣言勝ち5 先手宣言勝ち0 後手宣言勝ち5 19:38:44 先手引き分け38 後手引き分け56
lambda=0.7
05:08:37 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.7\final 05:08:37 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 05:08:37 対局数1000 先手勝ち493(53%) 後手勝ち425(46%) 引き分け82 05:08:37 engine1 05:08:37 勝ち456(49% R-2.27) 先手勝ち245(26%) 後手勝ち211(22%) 05:08:37 宣言勝ち8 先手宣言勝ち3 後手宣言勝ち5 05:08:37 先手引き分け38 後手引き分け44 05:08:37 engine2 05:08:37 勝ち462(50%) 先手勝ち248(27%) 後手勝ち214(23%) 05:08:37 宣言勝ち5 先手宣言勝ち5 後手宣言勝ち0 05:08:37 先手引き分け44 後手引き分け38
lambda=0.8
14:50:43 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.8\final 14:50:43 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 14:50:43 対局数1000 先手勝ち483(53%) 後手勝ち421(46%) 引き分け96 14:50:43 engine1 14:50:43 勝ち429(47% R-17.69) 先手勝ち230(25%) 後手勝ち199(22%) 14:50:43 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 14:50:43 先手引き分け40 後手引き分け56 14:50:43 engine2 14:50:43 勝ち475(52%) 先手勝ち253(27%) 後手勝ち222(24%) 14:50:43 宣言勝ち5 先手宣言勝ち2 後手宣言勝ち3 14:50:43 先手引き分け56 後手引き分け40
lambda=0.9
00:33:43 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.9\final 00:33:43 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 00:33:43 対局数1000 先手勝ち431(47%) 後手勝ち475(52%) 引き分け94 00:33:43 engine1 00:33:43 勝ち405(44% R-36.95) 先手勝ち196(21%) 後手勝ち209(23%) 00:33:43 宣言勝ち7 先手宣言勝ち3 後手宣言勝ち4 00:33:43 先手引き分け50 後手引き分け44 00:33:43 engine2 00:33:43 勝ち501(55%) 先手勝ち235(25%) 後手勝ち266(29%) 00:33:43 宣言勝ち2 先手宣言勝ち2 後手宣言勝ち0 00:33:43 先手引き分け44 後手引き分け50