nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2018-06-06 halfkp-attackersaroundking_256x2-32-32 機械学習1周目追加学習 + elmo絞り1周目相当

tanuki- 2018-06-06 halfkp-attackersaroundking_256x2-32-32 機械学習1周目追加学習 + elmo絞り1周目相当

  • 棋譜生成
    • 機械学習1周目追加学習分
      • tanuki-棋譜生成ルーチン
        • depth 8
        • 開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
        • 50億局面生成
        • 対局は打ち切らず詰みの局面まで学習データに出力する
        • 評価関数はApery SDT5
      • elmo絞り1周目相当分
        • NNUE v1.0+tanuki-棋譜生成ルーチン
          • depth 16
          • 反復深化のイテレーション終了時またはFail-high/low時に探索ノード数が20000を超えていたら終了する
          • 開始局面はfoodgate上の棋譜の32手目までから1局面ランダムに選択し、ランダムに1手指した局面とする
          • 5億局面生成
          • 対局は打ち切らず詰みの局面まで学習データに出力する
          • 評価関数は zoukin2.2018-03-12.halfkp_256x2-32-32.add.lambda=0.5.eval_limit=32000 (tanuki-wcsc28評価関数)
        • シャフル
          • あり
        • 機械学習
          • NNUE機械学習ルーチン v1.0
          • ネットワーク halfkp-attackersaroundking_256x2-32-32
          • 学習手法 SGD ミニバッチ法
          • batchsize 1000000
          • lambda 0.5
          • eta
            • 機械学習1周目追加学習分
              • 0.1
            • 機械学習2周目相当分
              • 0.01
            • newbob_decay 0.5
            • nn_batch_size 1000
            • eval_save_interval 100000000
            • loss_output_interval 1000000
            • mirror_percentage 50
            • eval_limit 32000
          • レーティング測定
            • 対局相手
              • NNUE v1.0 + やねうら王 v4.82 + halfkp-256x2-32-32 で上記と同じ条件で学習させたもの
            • 思考時間: 5000ms
            • 全対局数: 1000
            • 同時対局数: 24
            • ハッシュサイズ: 256
            • 開始局面: やねうら王互換局面集24手目からランダムに選択

            実験結果

            機械学習1周目追加学習分

            07:56:57.383 engine1=F:\hnoda\nnue.git\source\YaneuraOu-by-gcc.halfkp_256x2-32-32.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=1.add.lambda=0.5.eval_limit=32000\final 07:56:57.383 engine2=F:\hnoda\nnue.git\source\YaneuraOu-by-gcc.halfkp-attackersaroundking_256x2-32-32.exe eval2=F:\hnoda\nnue\eval\halfkp-attackersaroundking_256x2-32-32.iteration=1.add.lambda=0.5.eval_limit=32000\final 07:56:57.383 対局数1000 先手勝ち482(50%) 後手勝ち472(49%) 引き分け46 07:56:57.383 engine1 07:56:57.383 勝ち574(60% R71.65) 先手勝ち292(30%) 後手勝ち282(29%) 07:56:57.383 宣言勝ち10 先手宣言勝ち5 後手宣言勝ち5 07:56:57.383 先手引き分け22 後手引き分け24 07:56:57.383 engine2 07:56:57.383 勝ち380(39%) 先手勝ち190(19%) 後手勝ち190(19%) 07:56:57.383 宣言勝ち7 先手宣言勝ち3 後手宣言勝ち4 07:56:57.383 先手引き分け24 後手引き分け22

            elmo絞り1周目相当 分

            08:00:20.395 engine1=F:\hnoda\nnue.git\source\YaneuraOu-by-gcc.halfkp_256x2-32-32.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=1.add2\final 08:00:20.395 engine2=F:\hnoda\nnue.git\source\YaneuraOu-by-gcc.halfkp-attackersaroundking_256x2-32-32.exe eval2=F:\hnoda\nnue\eval\halfkp-attackersaroundking_256x2-32-32.iteration=1.add2\final 08:00:20.395 対局数1000 先手勝ち502(52%) 後手勝ち460(47%) 引き分け38 08:00:20.395 engine1 08:00:20.395 勝ち568(59% R63.54) 先手勝ち297(30%) 後手勝ち271(28%) 08:00:20.395 宣言勝ち14 先手宣言勝ち4 後手宣言勝ち10 08:00:20.395 先手引き分け17 後手引き分け21 08:00:20.395 engine2 08:00:20.395 勝ち394(40%) 先手勝ち205(21%) 後手勝ち189(19%) 08:00:20.395 宣言勝ち3 先手宣言勝ち2 後手宣言勝ち1 08:00:20.395 先手引き分け21 後手引き分け17