tanuki- 2019-02-21 halfkp_256x2-32-32 lambaを変化させたうえでの追加学習
- 棋譜生成
- tanuki-棋譜生成ルーチン
- 評価関数 halfkp_256x2-32-32.iteration=5.exact
- 思考ノード数 50万
- 開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
- 3億局面
- 対局は打ち切らず詰みの局面まで学習データに出力する
- シャフル
- あり
- 機械学習
- NNUE機械学習ルーチン v1.0
- ネットワーク halfkp_256x2-32-32
- 学習手法 SGD ミニバッチ法
- batchsize 1000000
- lambda 1.0で学習後、さらに0.4で追加学習
- eta 0.01
- newbob_decay 0.5
- nn_batch_size 1000
- eval_save_interval 100,000,000
- loss_output_interval 1,000,000
- mirror_percentage 50
- eval_limit 32000
- レーティング測定
- 対局相手
- halfkp_256x2-32-32.iteration=5.exact
- NNUEkaiX
- orqha
- illqha3
- 思考ノード数: 200万ノード
- 全対局数: 1000
- 同時対局数: 20
- ハッシュサイズ: 512
- 開始局面: やねうら王互換局面集24手目からランダムに選択
実験結果
ロス
lambda=1.0による追加学習
lambda=1.0で追加学習したあとの、lambda=0.4による追加学習
レーティング測定結果
16:13:52 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.add.lambda=1.0\final 16:13:52 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact\final 16:13:52 対局数1000 先手勝ち494(54%) 後手勝ち413(45%) 引き分け93 16:13:52 engine1 16:13:52 勝ち413(45% R-31.11) 先手勝ち223(24%) 後手勝ち190(20%) 16:13:52 宣言勝ち8 先手宣言勝ち8 後手宣言勝ち0 16:13:52 先手引き分け34 後手引き分け59 16:13:52 engine2 16:13:52 勝ち494(54%) 先手勝ち271(29%) 後手勝ち223(24%) 16:13:52 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 16:13:52 先手引き分け59 後手引き分け34
04:52:16 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.add2.lambda=0.4\final 04:52:16 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact\final 04:52:16 対局数1000 先手勝ち467(50%) 後手勝ち453(49%) 引き分け80 04:52:16 engine1 04:52:16 勝ち489(53% R21.93) 先手勝ち252(27%) 後手勝ち237(25%) 04:52:16 宣言勝ち3 先手宣言勝ち0 後手宣言勝ち3 04:52:16 先手引き分け41 後手引き分け39 04:52:16 engine2 04:52:16 勝ち431(46%) 先手勝ち215(23%) 後手勝ち216(23%) 04:52:16 宣言勝ち4 先手宣言勝ち0 後手宣言勝ち4 04:52:16 先手引き分け39 後手引き分け41
15:19:44 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.add2.lambda=0.4\final 15:19:44 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\illqha3 15:19:44 対局数1000 先手勝ち510(54%) 後手勝ち430(45%) 引き分け60 15:19:44 engine1 15:19:44 勝ち510(54% R29.64) 先手勝ち279(29%) 後手勝ち231(24%) 15:19:44 宣言勝ち2 先手宣言勝ち1 後手宣言勝ち1 15:19:44 先手引き分け37 後手引き分け23 15:19:44 engine2 15:19:44 勝ち430(45%) 先手勝ち231(24%) 後手勝ち199(21%) 15:19:44 宣言勝ち12 先手宣言勝ち8 後手宣言勝ち4 15:19:44 先手引き分け23 後手引き分け37
22:12:44 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.add2.lambda=0.4\final 22:12:44 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\NNUEkaiX 22:12:44 対局数1000 先手勝ち461(48%) 後手勝ち498(51%) 引き分け41 22:12:44 engine1 22:12:44 勝ち492(51% R9.06) 先手勝ち241(25%) 後手勝ち251(26%) 22:12:44 宣言勝ち5 先手宣言勝ち1 後手宣言勝ち4 22:12:44 先手引き分け26 後手引き分け15 22:12:44 engine2 22:12:44 勝ち467(48%) 先手勝ち220(22%) 後手勝ち247(25%) 22:12:44 宣言勝ち15 先手宣言勝ち10 後手宣言勝ち5 22:12:44 先手引き分け15 後手引き分け26
05:10:03 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.add2.lambda=0.4\final 05:10:03 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\orqha 05:10:03 対局数1000 先手勝ち514(54%) 後手勝ち427(45%) 引き分け59 05:10:03 engine1 05:10:03 勝ち451(47% R-14.41) 先手勝ち247(26%) 後手勝ち204(21%) 05:10:03 宣言勝ち6 先手宣言勝ち4 後手宣言勝ち2 05:10:03 先手引き分け24 後手引き分け35 05:10:03 engine2 05:10:03 勝ち490(52%) 先手勝ち267(28%) 後手勝ち223(23%) 05:10:03 宣言勝ち4 先手宣言勝ち0 後手宣言勝ち4 05:10:03 先手引き分け35 後手引き分け24