nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2018-01-13 discount絞り

tanuki- 2018-01-13 discount絞り

  • 棋譜生成
    • tanuki-棋譜生成ルーチン
    • 評価関数
      • Apery sdt5 評価関数
    • 開始局面
      • 2chkifuおよびfloodgateの全局面からランダムに選択
      • 選択した局面の合法手からランダムに1手指した局面を開始局面とする
    • 探索深さ 8
    • 自己対戦は途中で打ち切らず詰みの局面まで学習データに含める
    • 入玉宣言勝ちも学習データに含める
    • 生成局面数 50億
  • 機械学習
    • tanuki-機械学習ルーチン
    • 学習手法 Adam ミニバッチ法
    • 学習率 0.2
    • ミニバッチサイズ 100万
    • 元の評価関数 Apery sdt5 評価関数
    • 検証データは100万局面生成したものをそのまま使っている
    • 学習データ 50億局面
    • 学習局面数 50億局面

    実験結果

    elmo絞り

    14:56:24 engine1=YaneuraOu-2017-early.exe eval1=eval\2018-01-09-10-08-3814:56:24 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format14:56:24 T1,b5000,453 - 42 - 505(47.29% R-18.88) win black: white = 52.40% : 47.60% declaration win engine1=0 engine2=0

    dicount絞り (評価値のまま重み付き平均化した場合)

    21:06:20 engine1=YaneuraOu-2017-early.exe eval1=eval\2018-01-10-16-51-5321:06:20 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format21:06:20 T1,b5000,431 - 36 - 533(44.71% R-36.90) win black: white = 49.90% : 50.10% declaration win engine1=0 engine2=0

    dicount絞り (評価値を勝率に変換してから重み付き平均化した場合)

    03:28:39 engine1=YaneuraOu-2017-early.exe eval1=eval\2018-01-11-23-01-2703:28:39 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format03:28:39 T1,b5000,448 - 40 - 512(46.67% R-23.20) win black: white = 56.35% : 43.65% declaration win engine1=0 engine2=0