nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2018-06-04 halfkp-attackersaroundking_256x2-32-32 機械学習1周目

tanuki- 2018-06-04 halfkp-attackersaroundking_256x2-32-32 機械学習1周目

  • 棋譜生成
    • tanuki-棋譜生成ルーチン
      • depth 8
      • 開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面とする
      • 50億局面生成
      • 対局は打ち切らず詰みの局面まで学習データに出力する
      • 評価関数はApery SDT5
    • シャフル
      • あり
    • 機械学習
      • NNUE機械学習ルーチン v1.0
      • ネットワーク halfkp-attackersaroundking_256x2-32-32
      • 学習手法 SGD ミニバッチ法
      • batchsize 1000000
      • lambda 1.0
      • eta 1.0
      • newbob_decay 0.5
      • nn_batch_size 1000
      • eval_save_interval 500000000
      • loss_output_interval 1000000
      • mirror_percentage 50
      • eval_limit 3000
    • レーティング測定
      • 対局相手
        • NNUE v1.0 + やねうら王 v4.82 + halfkp-256x2-32-32 で上記と同じ条件で学習させたもの
      • 思考時間: 5000ms
      • 全対局数: 1000
      • 同時対局数: 24
      • ハッシュサイズ: 256
      • 開始局面: やねうら王互換局面集24手目からランダムに選択

      実験結果

      engine1=F:\hnoda\nnue.git\source\YaneuraOu-by-gcc.halfkp_256x2-32-32.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32.iteration=1\final

      engine2=F:\hnoda\nnue.git\source\YaneuraOu-by-gcc.halfkp-attackersaroundking_256x2-32-32.exe eval2=F:\hnoda\nnue\eval\halfkp-attackersaroundking_256x2-32-32.iteration=1.fixed\final

      対局数1000 先手勝ち519(53%) 後手勝ち450(46%) 引き分け31

      engine1

      勝ち601(62% R85.21) 先手勝ち323(33%) 後手勝ち278(28%)

      宣言勝ち15 先手宣言勝ち8 後手宣言勝ち7

      先手引き分け20 後手引き分け11

      engine2

      勝ち368(37%) 先手勝ち196(20%) 後手勝ち172(17%)

      宣言勝ち5 先手宣言勝ち1 後手宣言勝ち4

      先手引き分け11 後手引き分け20