tanuki- 2020-09-10 HalfKPE9
棋譜生成
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠2 |
1手あたりの思考 | 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止する |
開始局面 | foodgate上の棋譜の32手目までから1局面ランダムに選択し、その局面を開始局面とした |
生成局面数 | 1億局面生成×25セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力する |
シャフル | tanuki-棋譜シャッフルルーチン |
機械学習
機械学習ルーチン | やねうら王機械学習ルーチン |
学習モデル | halfkpe9_256x2-32-32 |
学習手法 | SGD ミニバッチ法 |
USI_Hash | 16 |
loop | 100 |
batchsize | 1000000 |
lambda | 0.5 |
eta | 0.1 |
newbob_decay | 0.5 |
nn_batch_size | 1000 |
eval_save_interval | 500000000 |
loss_output_interval | 1000000 |
mirror_percentage | 50 |
eval_limit | 32000 |
weight_by_progress | 有効 学習率に(1.0-進行度)を掛けて学習させるというもの |
次元下げ | K・P・HalfRelativeKP・左右対称 |
use_hash_in_training | 0 |
初期ネットワークパラメーター | https://docs.google.com/document/d/1aRL8EOR2NB70YkJ19w0Tso-nYNI3oR5uNK2kbBJPSzs/edit |
レーティング測定
対局相手 | 水匠2 |
思考ノード数 | 300万ノード 5秒 |
対局数 | 1000 |
同時対局数 | 40 |
ハッシュサイズ | 1024 |
開始局面 | やねうら王互換局面集24手目からランダムに選択 平手 |
実験結果
機械学習
レーティング測定
対局条件 | 結果 |
対 水匠2評価関数 24手目から 1手300万ノード 1000対局 | 300万ノード24手目 engine1=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1.add.eta=0.1.lambda=0.5\final engine2=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち498(51%) 後手勝ち471(48%) 引き分け31 engine1 勝ち562(57% R56.06) 先手勝ち293(30%) 後手勝ち269(27%) 宣言勝ち1 先手宣言勝ち0 後手宣言勝ち1 先手引き分け19 後手引き分け12 engine2 勝ち407(42%) 先手勝ち205(21%) 後手勝ち202(20%) 宣言勝ち21 先手宣言勝ち16 後手宣言勝ち5 先手引き分け12 後手引き分け19 562,31,407 |
対 水匠2評価関数 平手から 1手300万ノード 1000対局 | engine1=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1.add.eta=0.1.lambda=0.5\final engine2=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち536(55%) 後手勝ち432(44%) 引き分け32 engine1 勝ち542(55% R41.84) 先手勝ち289(29%) 後手勝ち253(26%) 宣言勝ち1 先手宣言勝ち0 後手宣言勝ち1 先手引き分け21 後手引き分け11 engine2 勝ち426(44%) 先手勝ち247(25%) 後手勝ち179(18%) 宣言勝ち6 先手宣言勝ち3 後手宣言勝ち3 先手引き分け11 後手引き分け21 542,32,426 |
対 水匠2評価関数 24手目から 1手5秒 1000対局 | engine1=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1.add.eta=0.1.lambda=0.5\final engine2=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち523(53%) 後手勝ち450(46%) 引き分け27 engine1 勝ち494(50% R5.36) 先手勝ち269(27%) 後手勝ち225(23%) 宣言勝ち2 先手宣言勝ち2 後手宣言勝ち0 先手引き分け13 後手引き分け14 engine2 勝ち479(49%) 先手勝ち254(26%) 後手勝ち225(23%) 宣言勝ち16 先手宣言勝ち8 後手宣言勝ち8 先手引き分け14 後手引き分け13 494,27,479 |
対 水匠2評価関数 平手から 1手5秒 1000対局 | engine1=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1.add.eta=0.1.lambda=0.5\final engine2=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち506(52%) 後手勝ち465(47%) 引き分け29 engine1 勝ち470(48% R-11.10) 先手勝ち240(24%) 後手勝ち230(23%) 宣言勝ち3 先手宣言勝ち3 後手宣言勝ち0 先手引き分け16 後手引き分け13 engine2 勝ち501(51%) 先手勝ち266(27%) 後手勝ち235(24%) 宣言勝ち23 先手宣言勝ち13 後手宣言勝ち10 先手引き分け13 後手引き分け16 470,29,501 |