tanuki- 2019-01-03 halfkp_256x2-32-32 やねうら王月刊教師局面 2018年1月号 2周目

棋譜生成

tanuki-棋譜生成ルーチン

評価関数 halfkp_256x2-32-32.iteration=2.kifu=yane
思考ノード数 5万
開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
3億局面生成
対局は打ち切らず詰みの局面まで学習データに出力する

シャフル

あり

機械学習

NNUE機械学習ルーチン v1.0
ネットワーク halfkp_256x2-32-32
学習手法 SGD ミニバッチ法
batchsize 1000000
lambda 0.4
eta 0.01
newbob_decay 0.5
nn_batch_size 1000
eval_save_interval 100000000
loss_output_interval 1000000
mirror_percentage 50
eval_limit 32000

レーティング測定

対局相手

halfkp_256x2-32-32.iteration=2.kifu=yane
halfkp_256x2-32-32.iteration=5.exact

思考ノード数: 200万ノード
全対局数: 1000
同時対局数: 20
ハッシュサイズ: 512
開始局面: やねうら王互換局面集24手目からランダムに選択

実験結果

ロス

レーティング測定結果

engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=3.kifu=yane\final

engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=2.kifu=yane\final

対局数1000 先手勝ち435(46%) 後手勝ち505(53%) 引き分け60

engine1

勝ち460(48% R-7.39) 先手勝ち210(22%) 後手勝ち250(26%)

宣言勝ち42 先手宣言勝ち18 後手宣言勝ち24

先手引き分け20 後手引き分け40

engine2

勝ち480(51%) 先手勝ち225(23%) 後手勝ち255(27%)

宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0

先手引き分け40 後手引き分け20

engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=3.kifu=yane\final

engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact\final

対局数1000 先手勝ち493(51%) 後手勝ち457(48%) 引き分け50

engine1

勝ち371(39% R-77.32) 先手勝ち197(20%) 後手勝ち174(18%)

宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0

先手引き分け26 後手引き分け24

engine2

勝ち579(60%) 先手勝ち296(31%) 後手勝ち283(29%)

宣言勝ち33 先手宣言勝ち22 後手宣言勝ち11

先手引き分け24 後手引き分け26