tanuki- 2018-01-23 Apery棋譜生成ルーチン

棋譜生成

Apery棋譜生成ルーチン
評価関数

Apery sdt5 評価関数

開始局面

roots.hcpより選択
選択された局面からランダムに1手指した局面から開始

探索深さ 8
自己対戦を打ち切る評価値の絶対値: 10000
入玉宣言勝ちも学習データに含める
生成局面数 50億

機械学習

tanuki-機械学習ルーチン

学習手法 Adam ミニバッチ法
学習率 0.5
ミニバッチサイズ 100万
元の評価関数 Apery sdt5 評価関数
検証データ: 生成したデータから一部を抽出
学習データ 50億局面-検証データ分
学習局面数 50億局面

Apery機械学習ルーチン

実験結果

Apery棋譜生成ルーチン + tanuki-機械学習ルーチン

13:05:22 engine1=YaneuraOu-2017-early.exe eval1=T:\hakubishin-\exe\eval\2018-01-22-04-11-34 13:05:22 engine2=YaneuraOu-2017-early.exe eval2=T:\hakubishin-\exe\eval\apery_sdt5_eval_twig_format 13:05:22 T1,b5000,444 - 52 - 504(46.84% R-22.02) win black: white = 50.42% : 49.58% declaration win engine1=0 engine2=0

実験2

Apery棋譜生成ルーチン + Apery機械学習ルーチン

engine1=YaneuraOu-2017-early.exe eval1=T:\YaneuraOu-2018-Otafuku-KPPT_V480\2018-01-28-22-03engine2=YaneuraOu-2017-early.exe eval2=T:\hakubishin-\exe\eval\apery_sdt5_eval_twig_formatT1,b5000,481 - 57 - 462(51.01% R7.00) win black: white = 52.92% : 47.08% declaration win engine1=0 engine2=0