tanuki- 2020-09-10 HalfKPE9

tanuki- 2020-09-10 HalfKPE9

棋譜生成

生成ルーチン tanuki-棋譜生成ルーチン
評価関数 水匠2
1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止する
開始局面 foodgate上の棋譜の32手目までから1局面ランダムに選択し、その局面を開始局面とした
生成局面数 1億局面生成×25セット
生成条件 対局は打ち切らず詰みの局面まで学習データに出力する
シャフル tanuki-棋譜シャッフルルーチン

機械学習

機械学習ルーチン やねうら王機械学習ルーチン
学習モデル halfkpe9_256x2-32-32
学習手法 SGD ミニバッチ法
USI_Hash 16
loop 100
batchsize 1000000
lambda 1.0
eta 1.0
newbob_decay 0.5
nn_batch_size 1000
eval_save_interval 500000000
loss_output_interval 1000000
mirror_percentage 50
eval_limit 32000
weight_by_progress 有効 学習率に(1.0-進行度)を掛けて学習させるというもの
次元下げ K・P・HalfRelativeKP・左右対称
use_hash_in_training 0

レーティング測定

対局相手 水匠2
思考ノード数 300万ノード 5秒
対局数 1000
同時対局数 40
ハッシュサイズ 1024
開始局面 やねうら王互換局面集24手目からランダムに選択 平手

実験結果

機械学習

レーティング測定

対局条件 結果
対 水匠2評価関数 24手目から 1手300万ノード 1000対局 engine1=D:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1\final engine2=D:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち484(50%) 後手勝ち470(49%) 引き分け46 engine1 勝ち528(55% R37.29) 先手勝ち271(28%) 後手勝ち257(26%) 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 先手引き分け20 後手引き分け26 engine2 勝ち426(44%) 先手勝ち213(22%) 後手勝ち213(22%) 宣言勝ち15 先手宣言勝ち8 後手宣言勝ち7 先手引き分け26 後手引き分け20 528,46,426
対 水匠2評価関数 平手から 1手300万ノード 1000対局 engine1=D:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1\final engine2=D:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち487(52%) 後手勝ち434(47%) 引き分け79 engine1 勝ち492(53% R23.80) 先手勝ち258(28%) 後手勝ち234(25%) 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 先手引き分け33 後手引き分け46 engine2 勝ち429(46%) 先手勝ち229(24%) 後手勝ち200(21%) 宣言勝ち29 先手宣言勝ち13 後手宣言勝ち16 先手引き分け46 後手引き分け33 492,79,429
対 水匠2評価関数 24手目から 1手5秒 1000対局 engine1=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1\final engine2=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち500(51%) 後手勝ち476(48%) 引き分け24 engine1 勝ち456(46% R-22.82) 先手勝ち239(24%) 後手勝ち217(22%) 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 先手引き分け11 後手引き分け13 engine2 勝ち520(53%) 先手勝ち261(26%) 後手勝ち259(26%) 宣言勝ち13 先手宣言勝ち6 後手宣言勝ち7 先手引き分け13 後手引き分け11 456,24,520
対 水匠2評価関数 平手から 1手5秒 1000対局 engine1=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine1\source\YaneuraOu-by-gcc.exe eval1=D:\hnoda\shogi\eval\halfkpe9_256x2-32-32.iteration=1\final engine2=D:\Jenkins\workspace\TanukiColiseum.2020-09-10\engine2\source\YaneuraOu-by-gcc.exe eval2=D:\hnoda\suisho-wcsoc2020\eval 対局数1000 先手勝ち525(54%) 後手勝ち430(45%) 引き分け45 engine1 勝ち462(48% R-11.28) 先手勝ち247(25%) 後手勝ち215(22%) 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 先手引き分け27 後手引き分け18 engine2 勝ち493(51%) 先手勝ち278(29%) 後手勝ち215(22%) 宣言勝ち11 先手宣言勝ち6 後手宣言勝ち5 先手引き分け18 後手引き分け27 462,45,493