tanuki- 2019-11-17 halfkp_256x2-32-32-sc
- 棋譜生成
- 機械学習1週目および1周目追加学習
- 生成ルーチン
- tanuki-棋譜生成ルーチン
- 評価関数
- KPPT
- Apery SDT5
- 1手当たりの思考
- 探索深さ 8
- 開始局面
- foodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面
- 生成局面数
- 50億
- 生成条件
- 対局は打ち切らず詰みの局面まで学習データに出力する
- 機械学習2週目以降(強化学習1週目以降)
- 生成ルーチン
- tanuki-棋譜生成ルーチン
- 評価関数
- halfkp_256x2-32-32-sc
- 1手あたりの思考
- 思考ノード数 50万
- 探索途中に思考ノード数上限に達したら即座に思考を停止する
- 開始局面
- foodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面
- 生成局面数
- 3千万局面生成×10セット
- 生成条件
- 対局は打ち切らず詰みの局面まで学習データに出力する
- シャフル
- あり
- 機械学習
- やねうら王機械学習ルーチン
- 学習モデル
- halfkp_256x2-32-32-sc
- halfkp_256x2-32-32の出力層に、隠れ層1層目の出力にアフィン変換を掛けたものを追加したもの
- 学習手法
- SGD
- ミニバッチ法
- 学習パラメーター
- Hash
- 4096
- loop
- 100
- batchsize
- 1000000
- lambda
- 機械学習1周目
- 1.0
- 機械学習1周目追加学習委以降
- 0.5
- eta
- 機械学習1周目
- 0.5
- 機械学習1周目追加学習
- 0.1
- 機械学習2周目以降(強化学習1周目以降)
- 0.01
- newbob_decay
- 0.5
- nn_batch_size
- 1000
- eval_save_interval
- 100000000
- loss_output_interval
- 1000000
- mirror_percentage
- 50
- eval_limit
- 機械学習1周目
- 3000
- 機械学習1周目追加学習以降
- 32000
- レーティング測定
- 対局相手
- tanuki-wcsc29-2019-05-06
- 思考ノード数: 200万ノード
- 全対局数: 1000
- 同時対局数: 20
- ハッシュサイズ: 512
- 開始局面: やねうら王互換局面集24手目からランダムに選択
実験結果
機械学習1周目
22:59:08 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=\\tk1-algo-02\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=1.eta=0.5\final
22:59:08 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval
22:59:08 対局数1000 先手勝ち496(50%) 後手勝ち489(49%) 引き分け15
22:59:08 engine1
22:59:08 勝ち291(29% R-150.99) 先手勝ち154(15%) 後手勝ち137(13%)
22:59:08 宣言勝ち7 先手宣言勝ち3 後手宣言勝ち4
22:59:08 先手引き分け8 後手引き分け7
22:59:08 engine2
22:59:08 勝ち694(70%) 先手勝ち342(34%) 後手勝ち352(35%)
22:59:08 宣言勝ち1 先手宣言勝ち1 後手宣言勝ち0
22:59:08 先手引き分け7 後手引き分け8
機械学習1周目追加学習
17:37:42 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=1.lambda=0.5.eta=0.10.add\final
17:37:42 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval
17:37:42 対局数1000 先手勝ち497(51%) 後手勝ち472(48%) 引き分け31
17:37:42 engine1
17:37:42 勝ち376(38% R-79.15) 先手勝ち201(20%) 後手勝ち175(18%)
17:37:42 宣言勝ち4 先手宣言勝ち1 後手宣言勝ち3
17:37:42 先手引き分け16 後手引き分け15
17:37:42 engine2
17:37:42 勝ち593(61%) 先手勝ち296(30%) 後手勝ち297(30%)
17:37:42 宣言勝ち3 先手宣言勝ち1 後手宣言勝ち2
17:37:42 先手引き分け15 後手引き分け16
機械学習2周目(強化学習1周目)
20:11:07 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=2\final
20:11:07 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval
20:11:07 対局数1000 先手勝ち502(52%) 後手勝ち463(47%) 引き分け35
20:11:07 engine1
20:11:07 勝ち442(45% R-29.23) 先手勝ち233(24%) 後手勝ち209(21%)
20:11:07 宣言勝ち2 先手宣言勝ち1 後手宣言勝ち1
20:11:07 先手引き分け13 後手引き分け22
20:11:07 engine2
20:11:07 勝ち523(54%) 先手勝ち269(27%) 後手勝ち254(26%)
20:11:07 宣言勝ち8 先手宣言勝ち6 後手宣言勝ち2
20:11:07 先手引き分け22 後手引き分け13
機械学習3周目(強化学習2周目)
02:09:51 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=3\final
02:09:51 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval
02:09:51 対局数1000 先手勝ち515(53%) 後手勝ち450(46%) 引き分け35
02:09:51 engine1
02:09:51 勝ち459(47% R-16.94) 先手勝ち250(25%) 後手勝ち209(21%)
02:09:51 宣言勝ち12 先手宣言勝ち6 後手宣言勝ち6
02:09:51 先手引き分け14 後手引き分け21
02:09:51 engine2
02:09:51 勝ち506(52%) 先手勝ち265(27%) 後手勝ち241(24%)
02:09:51 宣言勝ち10 先手宣言勝ち3 後手宣言勝ち7
02:09:51 先手引き分け21 後手引き分け14
機械学習4周目(強化学習3周目)
08:01:46 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=4\final
08:01:46 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval
08:01:46 対局数1000 先手勝ち502(52%) 後手勝ち463(47%) 引き分け35
08:01:46 engine1
08:01:46 勝ち460(47% R-16.21) 先手勝ち245(25%) 後手勝ち215(22%)
08:01:46 宣言勝ち8 先手宣言勝ち5 後手宣言勝ち3
08:01:46 先手引き分け16 後手引き分け19
08:01:46 engine2
08:01:46 勝ち505(52%) 先手勝ち257(26%) 後手勝ち248(25%)
08:01:46 宣言勝ち8 先手宣言勝ち4 後手宣言勝ち4
08:01:46 先手引き分け19 後手引き分け16
機械学習5周目(強化学習4周目)
13:59:09 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=5\final
13:59:09 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval
13:59:09 対局数1000 先手勝ち506(52%) 後手勝ち456(47%) 引き分け38
13:59:09 engine1
13:59:09 勝ち440(45% R-29.69) 先手勝ち240(24%) 後手勝ち200(20%)
13:59:09 宣言勝ち8 先手宣言勝ち3 後手宣言勝ち5
13:59:09 先手引き分け20 後手引き分け18
13:59:09 engine2
13:59:09 勝ち522(54%) 先手勝ち266(27%) 後手勝ち256(26%)
13:59:09 宣言勝ち6 先手宣言勝ち1 後手宣言勝ち5
13:59:09 先手引き分け18 後手引き分け20