tanuki- 2017-08-14 実験結果

学習局面数 50億局面

apery_wcsc26から生成した

初手から6手ランダムに選択

探索深さ 6
自己対戦は評価値3000で打ち切る

機械学習

学習局面数 50億
学習率 0.5
学習手法 Adam ミニバッチ法
ミニバッチサイズ 100万
元の評価関数 apery_wcsc26
検証データは評価関数 apery_wcsc26から作成した

elmo lambda = 0.5

00:06:17 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-16-08-11-45\5000000000 00:06:17 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_wcsc26 00:06:17 T1,b2000,766 - 23 - 211(78.40% R223.98) win black: white = 50.15% : 49.85% declaration win black=0 white=0

01:53:18 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-16-08-11-45\5000000000 01:53:18 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27 01:53:18 T1,b2000,426 - 20 - 554(43.47% R-45.64) win black: white = 50.82% : 49.18% declaration win black=0 white=0

elmo lambda=0.3333

00:12:07 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-17-08-19-10\5000000000 00:12:07 engine2=YaneuraOu-2017-early.exe eval2=eval\apery_wcsc26 00:12:07 T1,b2000,758 - 11 - 231(76.64% R206.42) win black: white = 51.47% : 48.53% declaration win black=0 white=0

01:59:14 engine1=YaneuraOu-2017-early.exe eval1=eval\2017-08-17-08-19-10\5000000000 01:59:14 engine2=YaneuraOu-2017-early.exe eval2=eval\elmo_wcsc27 01:59:14 T1,b2000,431 - 22 - 547(44.07% R-41.40) win black: white = 52.45% : 47.55% declaration win black=0 white=0