nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2017-12-04 Apery式elmo絞り

tanuki- 2017-12-04 Apery式elmo絞り

  • 棋譜生成
    • 評価関数
      • sdt5 評価関数
    • 開始局面
      • 2chkifuおよびfloodgateの全局面からランダムに選択
      • 選択した局面の合法手からランダムに1手指した局面を開始局面とする
    • 探索深さ 8
    • 自己対戦は途中で打ち切らず詰みの局面まで学習データに含める
    • 入玉宣言勝ちも学習データに含める
    • 生成局面数 60億
  • 機械学習
    • 学習手法 Adam ミニバッチ法
    • 学習率 0.5
    • ミニバッチサイズ 100万
    • 元の評価関数 sdt5
    • 検証データは100万局面生成したものをそのまま使っている
    • 学習データ 60億局面
    • 学習局面数 60億局面

    実験結果

    16:39:25 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-02-07-45-45 16:39:25 engine2=YaneuraOu-2017-early.exe eval2=eval\tanuki-.2017-11-04-03-42-31.1-1 16:39:25 T1,b5000,483 - 44 - 473(50.52% R3.63) win black: white = 50.84% : 49.16% declaration win engine1=0 engine2=0

    00:22:49 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-12-02-07-45-45 00:22:49 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_sdt5_eval_twig_format 00:22:49 T1,b5000,419 - 32 - 549(43.29% R-46.94) win black: white = 50.72% : 49.28% declaration win engine1=0 engine2=0