nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2018-12-08 halfkp_256x2-32-32 lambda比較結果

tanuki- 2018-11-29 halfkp_256x2-32-32 自己対戦探索ノード数

  • 棋譜生成
    • NNUE v1.0+tanuki-棋譜生成ルーチン
      • depth 64
      • 探索ノード数が50kを超えたら探索を終了する
      • 開始局面はfoodgate上の棋譜の32手目までから1局面ランダムに選択し、ランダムに1手指した局面とする
      • 3億局面生成
      • 対局は打ち切らず詰みの局面まで学習データに出力する
      • 評価関数はhalfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4
      • 探索パラメーターをhyperopt+Gaussian Processで0.1秒思考に合わせて調整済み
    • シャフル
      • あり
    • 機械学習
      • NNUE機械学習ルーチン v1.0
      • ネットワーク halfkp_256x2-32-32
      • 学習手法 SGD ミニバッチ法
      • batchsize 1000000
      • lambda 0.4・0.5・0.6・0.7・0.8・0.9
      • eta 0.01
      • newbob_decay 0.5
      • nn_batch_size 1000
      • eval_save_interval 100000000
      • loss_output_interval 1000000
      • mirror_percentage 50
      • eval_limit 32000
    • レーティング測定
      • 対局相手
        • やねうら王 v4.83 TNK + halfkp-256x2-32-32 + halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4
        • やねうら王 v4.83 TNK + halfkp-256x2-32-32 + halfkp_256x2-32-32.iteration=5
          • 反復深化法のイテレーション終了時、またはFail-low/high時に探索ノード数が50kを超えている場合に、思考を終了した
        • 思考ノード数: 300万
        • 全対局数: 1000
        • 同時対局数: 23
        • ハッシュサイズ: 256
        • 開始局面: やねうら王互換局面集24手目からランダムに選択

        実験結果

        ロス

        レーティング測定結果

        lambda=0.4

        20:15:00 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact\final 20:15:00 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 20:15:00 対局数1000 先手勝ち497(54%) 後手勝ち409(45%) 引き分け94 20:15:00 engine1 20:15:00 勝ち471(51% R13.81) 先手勝ち254(28%) 後手勝ち217(23%) 20:15:00 宣言勝ち10 先手宣言勝ち7 後手宣言勝ち3 20:15:00 先手引き分け35 後手引き分け59 20:15:00 engine2 20:15:00 勝ち435(48%) 先手勝ち243(26%) 後手勝ち192(21%) 20:15:00 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 20:15:00 先手引き分け59 後手引き分け35

        lambda=0.5

        11:21:30 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.5\final 11:21:30 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 11:21:30 対局数1000 先手勝ち449(50%) 後手勝ち433(49%) 引き分け118 11:21:30 engine1 11:21:30 勝ち439(49% R-1.58) 先手勝ち224(25%) 後手勝ち215(24%) 11:21:30 宣言勝ち10 先手宣言勝ち3 後手宣言勝ち7 11:21:30 先手引き分け56 後手引き分け62 11:21:30 engine2 11:21:30 勝ち443(50%) 先手勝ち225(25%) 後手勝ち218(24%) 11:21:30 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 11:21:30 先手引き分け62 後手引き分け56

        lambda=0.6

        19:38:44 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.6\final 19:38:44 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 19:38:44 対局数1000 先手勝ち468(51%) 後手勝ち438(48%) 引き分け94 19:38:44 engine1 19:38:44 勝ち466(51% R9.97) 先手勝ち248(27%) 後手勝ち218(24%) 19:38:44 宣言勝ち7 先手宣言勝ち2 後手宣言勝ち5 19:38:44 先手引き分け56 後手引き分け38 19:38:44 engine2 19:38:44 勝ち440(48%) 先手勝ち220(24%) 後手勝ち220(24%) 19:38:44 宣言勝ち5 先手宣言勝ち0 後手宣言勝ち5 19:38:44 先手引き分け38 後手引き分け56

        lambda=0.7

        05:08:37 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.7\final 05:08:37 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 05:08:37 対局数1000 先手勝ち493(53%) 後手勝ち425(46%) 引き分け82 05:08:37 engine1 05:08:37 勝ち456(49% R-2.27) 先手勝ち245(26%) 後手勝ち211(22%) 05:08:37 宣言勝ち8 先手宣言勝ち3 後手宣言勝ち5 05:08:37 先手引き分け38 後手引き分け44 05:08:37 engine2 05:08:37 勝ち462(50%) 先手勝ち248(27%) 後手勝ち214(23%) 05:08:37 宣言勝ち5 先手宣言勝ち5 後手宣言勝ち0 05:08:37 先手引き分け44 後手引き分け38

        lambda=0.8

        14:50:43 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.8\final 14:50:43 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 14:50:43 対局数1000 先手勝ち483(53%) 後手勝ち421(46%) 引き分け96 14:50:43 engine1 14:50:43 勝ち429(47% R-17.69) 先手勝ち230(25%) 後手勝ち199(22%) 14:50:43 宣言勝ち0 先手宣言勝ち0 後手宣言勝ち0 14:50:43 先手引き分け40 後手引き分け56 14:50:43 engine2 14:50:43 勝ち475(52%) 先手勝ち253(27%) 後手勝ち222(24%) 14:50:43 宣言勝ち5 先手宣言勝ち2 後手宣言勝ち3 14:50:43 先手引き分け56 後手引き分け40

        lambda=0.9

        00:33:43 engine1=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=5.exact.lambda=0.9\final 00:33:43 engine2=F:\hnoda\YaneuraOu\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=4.nodes_searched=50000.lambda=0.4\final 00:33:43 対局数1000 先手勝ち431(47%) 後手勝ち475(52%) 引き分け94 00:33:43 engine1 00:33:43 勝ち405(44% R-36.95) 先手勝ち196(21%) 後手勝ち209(23%) 00:33:43 宣言勝ち7 先手宣言勝ち3 後手宣言勝ち4 00:33:43 先手引き分け50 後手引き分け44 00:33:43 engine2 00:33:43 勝ち501(55%) 先手勝ち235(25%) 後手勝ち266(29%) 00:33:43 宣言勝ち2 先手宣言勝ち2 後手宣言勝ち0 00:33:43 先手引き分け44 後手引き分け50