nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2021-10-11 ミニバッチサイズ

tanuki- 2021-10-11 ミニバッチサイズ

実験内容

  • ミニバッチのサイズ (nn_batch_size) を変化させながら学習させ、勝率を測定する

棋譜生成

生成ルーチン tanuki-棋譜生成ルーチン
評価関数 tanuki-wcsc28
1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード
開始局面 foodgate上の棋譜の24手目までから1局面ランダムに選択し、その局面を開始局面とした
生成局面数 1 億局面× 3 セット
生成条件 対局は打ち切らず詰みの局面まで学習データに出力した

機械学習

機械学習ルーチン やねうら王機械学習ルーチン
学習モデル halfkp_256x2-32-32
学習手法 SGD ミニバッチ法
USI_Hash 1024
Threads 16
loop 100
batchsize 1000000
lambda 0.4
eta 0.01
newbob_decay 0.5
nn_batch_size 100~100000
eval_save_interval 100000000
loss_output_interval 1000000
mirror_percentage 50
eval_limit 32000
weight_by_progress 無効
次元下げ K・P・HalfRelativeKP・左右対称
学習データ内で重複した局面の除外 しない
初期ネットワークパラメーター tanuki-wcsc28
勝敗項の教師信号 0.998074

レーティング測定

対局相手 tanuki-wcsc28
思考時間 持ち時間 900 秒 + 1 手 5 秒加算
対局数 2000
同時対局数 64
ハッシュサイズ 768
開始局面 たややん互換局面集

実験結果

機械学習

レーティング測定

まとめ