tanuki- 2019-01-03 halfkp_256x2-32-32 やねうら王月刊教師局面 2018年1月号 2周目
- 棋譜生成
- tanuki-棋譜生成ルーチン
- 評価関数 halfkp_256x2-32-32.iteration=2.kifu=yane
- 思考ノード数 5万
- 開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
- 3億局面生成
- 対局は打ち切らず詰みの局面まで学習データに出力する
- シャフル
- あり
- 機械学習
- NNUE機械学習ルーチン v1.0
- ネットワーク halfkp_256x2-32-32
- 学習手法 SGD ミニバッチ法
- batchsize 1000000
- lambda 0.4
- eta 0.01
- newbob_decay 0.5
- nn_batch_size 1000
- eval_save_interval 100000000
- loss_output_interval 1000000
- mirror_percentage 50
- eval_limit 32000
- レーティング測定
- 対局相手
- halfkp_256x2-32-32.iteration=2.kifu=yane
- halfkp_256x2-32-32.iteration=5.exact
- 思考ノード数: 200万ノード
- 全対局数: 1000
- 同時対局数: 20
- ハッシュサイズ: 512
- 開始局面: やねうら王互換局面集24手目からランダムに選択
実験結果
ロス
レーティング測定結果
engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=3.kifu=yane\final
engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=2.kifu=yane\final
対局数1000 先手勝ち435(46%) 後手勝ち505(53%) 引き分け60
engine1
勝ち460(48% R-7.39) 先手勝ち210(22%) 後手勝ち250(26%)
宣言勝ち42 先手宣言勝ち18 後手宣言勝ち24
先手引き分け20 後手引き分け40
engine2
勝ち480(51%) 先手勝ち225(23%) 後手勝ち255(27%)
宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0
先手引き分け40 後手引き分け20
engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=3.kifu=yane\final
engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact\final
対局数1000 先手勝ち493(51%) 後手勝ち457(48%) 引き分け50
engine1
勝ち371(39% R-77.32) 先手勝ち197(20%) 後手勝ち174(18%)
宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0
先手引き分け26 後手引き分け24
engine2
勝ち579(60%) 先手勝ち296(31%) 後手勝ち283(29%)
宣言勝ち33 先手宣言勝ち22 後手宣言勝ち11
先手引き分け24 後手引き分け26