tanuki- 2018-01-23 Apery棋譜生成ルーチン
- 棋譜生成
- Apery棋譜生成ルーチン
- 評価関数
- Apery sdt5 評価関数
- 開始局面
- roots.hcpより選択
- 選択された局面からランダムに1手指した局面から開始
- 探索深さ 8
- 自己対戦を打ち切る評価値の絶対値: 10000
- 入玉宣言勝ちも学習データに含める
- 生成局面数 50億
- 機械学習
- tanuki-機械学習ルーチン
- 学習手法 Adam ミニバッチ法
- 学習率 0.5
- ミニバッチサイズ 100万
- 元の評価関数 Apery sdt5 評価関数
- 検証データ: 生成したデータから一部を抽出
- 学習データ 50億局面-検証データ分
- 学習局面数 50億局面
- Apery機械学習ルーチン
実験結果
Apery棋譜生成ルーチン + tanuki-機械学習ルーチン
13:05:22 engine1=YaneuraOu-2017-early.exe eval1=T:\hakubishin-\exe\eval\2018-01-22-04-11-34 13:05:22 engine2=YaneuraOu-2017-early.exe eval2=T:\hakubishin-\exe\eval\apery_sdt5_eval_twig_format 13:05:22 T1,b5000,444 - 52 - 504(46.84% R-22.02) win black: white = 50.42% : 49.58% declaration win engine1=0 engine2=0
実験2
engine1=YaneuraOu-2017-early.exe eval1=T:\YaneuraOu-2018-Otafuku-KPPT_V480\2018-01-28-22-03engine2=YaneuraOu-2017-early.exe eval2=T:\hakubishin-\exe\eval\apery_sdt5_eval_twig_formatT1,b5000,481 - 57 - 462(51.01% R7.00) win black: white = 52.92% : 47.08% declaration win engine1=0 engine2=0