tanuki- 2019-02-16 halfkp_256x2-32-32 強化学習6周目 3千万局面×2セット 棋譜生成 tanuki-棋譜生成ルーチン 評価関数 halfkp_256x2-32-32.iteration=5.exact 思考ノード数 50万 開始局面はfoodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。