nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2017-08-17 elmo再現実験結果

tanuki- 2017-08-14 実験結果

  • 学習局面数 50億局面
    • apery_wcsc26から生成した
      • 初手から6手ランダムに選択
    • 探索深さ 6
    • 自己対戦は評価値3000で打ち切る
  • 機械学習
    • 学習局面数 50億
    • 学習率 0.5
    • 学習手法 Adam ミニバッチ法
    • ミニバッチサイズ 100万
    • 元の評価関数 apery_wcsc26
    • 検証データは 評価関数 apery_wcsc26から作成した

    elmo lambda = 0.5

    00:06:17 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-16-08-11-45\5000000000 00:06:17 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_wcsc26 00:06:17 T1,b2000,766 - 23 - 211(78.40% R223.98) win black: white = 50.15% : 49.85% declaration win black=0 white=0

    01:53:18 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-16-08-11-45\5000000000 01:53:18 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27 01:53:18 T1,b2000,426 - 20 - 554(43.47% R-45.64) win black: white = 50.82% : 49.18% declaration win black=0 white=0

    elmo lambda=0.3333

    00:12:07 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-17-08-19-10\5000000000 00:12:07 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_wcsc26 00:12:07 T1,b2000,758 - 11 - 231(76.64% R206.42) win black: white = 51.47% : 48.53% declaration win black=0 white=0

    01:59:14 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-17-08-19-10\5000000000 01:59:14 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27 01:59:14 T1,b2000,431 - 22 - 547(44.07% R-41.40) win black: white = 52.45% : 47.55% declaration win black=0 white=0