nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2017-10-14 depth 10 epoch 1

tanuki- 2017-10-14 depth 10 epoch 1

  • 棋譜生成
    • 評価関数
      • 2017-10-07-11-51-35 評価関数
    • 開始局面
      • 2chkifuおよびfloodgateの対局からランダムに対局を選択
      • 1~32手目からランダムに局面を選択
      • 選択した局面から0~6手、MultiPV5の中から等確率に指し手を選択
      • MultiPVで選択した指し手も教師局面に含める
    • 探索深さ 10
    • 自己対戦は途中で打ち切らず詰みの局面まで学習データに含める
    • 入玉宣言勝ちも学習データに含める
    • 生成局面数 6.5億
  • 機械学習
    • 学習手法 Adam ミニバッチ法
    • 学習率 0.5
    • ミニバッチサイズ 100万
    • 元の評価関数 2017-10-07-11-51-35
    • 検証データは100万局面生成したものをそのまま使っている

    実験結果

    実験1

    05:03:11.481 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-10-13-18-16-57\650000000

    05:03:11.481 engine2=YaneuraOu-2017-early.exe eval2=eval\2017-10-07-11-51-35\500000000

    05:03:11.481 T1,b2000,477 - 49 - 474(50.16% R1.10) win black: white = 52.79% : 47.21% declaration win black=0 white=0

    07:57:47.019 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-10-13-18-16-57\650000000

    07:57:47.019 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27

    07:57:47.019 T1,b2000,614 - 13 - 373(62.21% R86.58) win black: white = 50.25% : 49.75% declaration win black=0 white=0

    実験2

    depth 10 epoch 1で使用した5億局面も混ぜて学習させた (← これ合ってる…?)

    06:35:49.615 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-10-14-02-28-16\1150000000 06:35:49.615 engine2=YaneuraOu-2017-early.exe eval2=eval\2017-10-07-11-51-35\500000000 06:35:49.615 T1,b2000,492 - 34 - 474(50.93% R6.47) win black: white = 48.14% : 51.86% declaration win black=0 white=0

    09:27:08.617 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-10-14-02-28-16\1150000000 09:27:08.617 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27 09:27:08.617 T1,b2000,623 - 17 - 360(63.38% R95.27) win black: white = 51.58% : 48.42% declaration win black=0 white=0

    やねうら王互換局面集を使用した場合

    03:09:42.011 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-10-14-02-28-16\1150000000 03:09:42.011 engine2=YaneuraOu-2017-early.exe eval2=eval\2017-10-07-11-51-35\500000000 03:09:42.011 T1,b2000,492 - 43 - 465(51.41% R9.80) win black: white = 50.47% : 49.53% declaration win black=0 white=0

    06:01:12.323 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-10-14-02-28-16\1150000000 06:01:12.323 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27 06:01:12.323 T1,b2000,655 - 18 - 327(66.70% R120.68) win black: white = 54.58% : 45.42% declaration win black=0 white=0