2017-01-01から1年間の記事一覧
tanuki- 2017-12-17 Apery式elmo絞りL2正則化 棋譜生成 評価関数 sdt5 評価関数 開始局面 2chkifuおよびfloodgateの全局面からランダムに選択 選択した局面の合法手からランダムに1手指した局面を開始局面とする 探索深さ 8 自己対戦は途中で打ち切らず詰み…
tanuki- 2017-12-04 Apery式elmo絞り 棋譜生成 評価関数 sdt5 評価関数 開始局面 2chkifuおよびfloodgateの全局面からランダムに選択 選択した局面の合法手からランダムに1手指した局面を開始局面とする 探索深さ 8 自己対戦は途中で打ち切らず詰みの局面ま…
この記事はnodchipが第5回電王トーナメントに参加した記録です。項目の時系列がばらばらになってしまっていますが、ご了承下さい。 第5回電王トーナメント 2017年11月11~12日にかけて、株式会社ドワンゴ(以下ドワンゴ)主催の『第5回電王トーナメント』に参…
tanuki- 2017-10-14 depth 10 epoch 2 棋譜生成 評価関数 2017-10-26-17-06-28 評価関数 開始局面 2chkifuおよびfloodgateの棋譜からから選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確率に指し手を選択 MultiPVで選…
tanuki- 2017-10-14 depth 10 epoch 2 棋譜生成 評価関数 2017-10-20-00-18-32 評価関数 開始局面 まふ氏提供定跡学習用定跡データベースから選択 1~71手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確率に指し手を選択 MultiPV…
tanuki- 2017-10-14 depth 10 epoch 1 棋譜生成 評価関数 2017-10-07-11-51-35 評価関数 開始局面 2chkifuおよびfloodgateの対局からランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確率に指し手を選択…
tanuki- 2017-10-14 depth 10 epoch 2 棋譜生成 評価関数 2017-10-07-11-51-35 評価関数 開始局面 2chkifuおよびfloodgateの対局からランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確率に指し手を選択…
tanuki- 2017-09-28 depth 8 実験結果 棋譜生成 評価関数 2017-07-07-17-12-14評価関数 開始局面 2chkifuおよびfloodgateの対局からランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確率に指し手を選択 …
tanuki- 2017-09-16 KK・KKP次元下げ 実験結果 棋譜生成 評価関数 2017-07-07-17-12-14評価関数とelmoを1:1でブレンドしたもの 開始局面 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確…
tanuki- 2017-09-15 train/test loss 実験結果 棋譜生成 評価関数 2017-07-07-17-12-14評価関数とelmoを1:1でブレンドしたもの 開始局面 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確…
tanuki- 2017-09-10 部分シャッフル実験 棋譜生成 評価関数 2017-07-07-17-12-14評価関数とelmoを1:1でブレンドしたもの 開始局面 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等確率に指…
tanuki- 2017-09-09 Cyclical Learning Rate 実験結果 棋譜生成 評価関数 2017-07-07-17-12-14評価関数とelmoを1:1でブレンドしたもの 開始局面 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中か…
tanuki- 2017-08-28 ブリード・elmo絞り 実験結果 棋譜生成 評価関数 2017-07-07-17-12-14評価関数とelmoを1:1でブレンドしたもの 開始局面 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等…
tanuki- 2017-08-28 ブリード・elmo絞り 実験結果 棋譜生成 評価関数 2017-07-07-17-12-14評価関数とelmoを1:1でブレンドしたもの 開始局面 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局面から0~6手、MultiPV5の中から等…
tanuki- 2017-08-14 実験結果 学習局面数 50億局面 apery_wcsc26から生成した 初手から6手ランダムに選択 探索深さ 6 自己対戦は評価値3000で打ち切る 機械学習 学習局面数 50億 学習率 0.5 学習手法 Adam ミニバッチ法 ミニバッチサイズ 100万 元の評価関数…
tanuki- 2017-08-14 実験結果 学習局面数 50億局面 10億局面は過去に生成したもの 20億局面はelmoから、20億局面は20億局面は評価関数2017-07-07-17-12-14から新たに生成した 2chkifuからランダムに対局を選択 1~32手目からランダムに局面を選択 選択した局…
tanuki- 2017-08-03 実験結果 棋譜生成 生成局面数 60億局面 20億局面は過去に生成したもの 20億局面は評価関数2017-05-20-15-00-44から、20億局面は評価関数2017-07-07-17-12-14から新たに生成した 2chkifuからランダムに対局を選択 1~32手目からランダム…