2022-01-01から1年間の記事一覧
tanuki- 2022-12-27 Fine Tuning halfkp_1024x2-8-32 Suishopsv-150m 学習途中 実験内容 高ノード数の探索を用いて教師データを生成し、 halfkp_1024x2-8-32 評価関数を、水匠開発者杉村氏が公開している学習データ Suishopsv-150m を用いて Fine Tuning し…
tanuki- 2022-12-22 Fine Tuning halfkp_1024x2-8-32 Suishopsv-150m 実験内容 高ノード数の探索を用いて教師データを生成し、 halfkp_1024x2-8-32 評価関数を、水匠開発者杉村氏が公開している学習データ Suishopsv-150m で Fine Tuning し、レーティングを…
tanuki- 2022-12-16 Fine Tuning halfkp_1024x2-8-32 手数 実験内容 高ノード数の探索を用いて教師データを生成し、 halfkp_1024x2-8-32 評価関数を、学習データの最小手数と最大手数を指定して Fine Tuning し、レーティングを測定する。 棋譜生成 生成ルー…
tanuki- 2022-12-16 Fine Tuning halfkp_1024x2-8-32 学習途中 実験内容 高ノード数の探索を用いて教師データを生成し、 halfkp_1024x2-8-32 評価関数を Fine Tuning し、学習途中の評価関数のレーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生…
tanuki- 2022-12-14 Fine Tuning halfkp_1024x2-8-32 実験内容 高ノード数の探索を用いて教師データを生成し、 halfkp_1024x2-8-32 評価関数を Fine Tuning し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠 5 FV…
tanuki- 2022-11-29 Fine Tuning 実験内容 高ノード数の探索を用いて教師データを生成し、既存の評価関数を Fine Tuning し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠 5 FV_SCALE=16 1手あたりの思考 深さ最…
tanuki- 2022-11-03 nnue-pytorch halfkp_1024x2-8-32 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード…
tanuki- 2022-10-31 nnue-pytorch やねうら王学習率スケジューラー 実験内容 nnue-pytorch を用いた学習で、 やねうら王に実装されている newbob 風学習率スケジューラーを用いて学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5…
tanuki- 2022-10-27 nnue-pytorch Label Smoothing 実験内容 nnue-pytorch を用いた学習で、 Label Smoothing を適用し、リグレッションがないことを確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …
tanuki- 2022-10-26 nnue-pytorch GeForce RTX 4090 実験内容 nnue-pytorch を用いた学習で、 GeForce RTX 4090 を用い、リグレッションがないことを確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …
tanuki- 2022-08-05 教師局面生成時の開始局面 (s-book_black) (3) 実験内容 教師局面の生成時、開始局面として floodgate の棋譜の局面と、 s-book_black に収録されている局面を使用し、学習した評価関数のレーティングを計測する。 棋譜生成 生成ルーチン…
tanuki- 2022-08-01 教師局面生成時の開始局面 (s-book_black) (2) 実験内容 教師局面の生成時、開始局面として s-book_black に収録されている局面を使用し、学習した評価関数のレーティングを計測する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評…
tanuki- 2022-07-26 やねうら王学習部リグレッション調査 再追試 実験内容 やねうら王最新版の qsearch() 内の move count に関する枝刈りを無効化し、評価関数を学習し、 V5.33 で学習したものと比較する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン …
tanuki- 2022-07-21 tanuki- 学習部 リビジョン変更 (2) 実験内容 tanuki- の学習部を、やねうら王 V5.33 に変更し、勝敗項の教師信号を 1.0 に設定し、評価関数を学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数…
tanuki- 2022-07-20 tanuki- 学習部 リビジョン変更 実験内容 tanuki- の学習部を、やねうら王 V5.33 に変更し、評価関数を学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠 5 FV_SCALE=16 1手あたりの思考 …
tanuki- 2022-07-18 tanuki- 学習部 リグレッション調査 (2) 実験内容 前回の実験で、シャッフル時の qsearch をしていなかったため、 qsearch を行ったうえで、再度学習器にリグレッションがないかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ル…
tanuki- 2022-07-16 tanuki- 学習部 リグレッション調査 実験内容 前回の実験結果に不審な点があったため、 tanuki- 学習部にリグレッションがないか確認する。 https://docs.google.com/document/d/12PFODs6RGkAtILO9BxvVSRRsY80nwqYxJz-HO05VH5I/edit?usp=…
tanuki- 2022-07-13 nnue-pytorch 学習率調整 (2) 実験内容 nnue-pytorch を用いた学習で、学習率を 0.00025 に設定し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思…
tanuki- 2022-07-12 教師局面生成時の開始局面 (s-book_black) 実験内容 教師局面の生成時、開始局面として s-book_black に収録されている局面を使用し、学習した評価関数のレーティングを計測する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関…
tanuki- 2022-07-10 nnue-pytorch 学習率調整 実験内容 nnue-pytorch を用いた学習で、いくつかの学習率を試し、最もロスが下がる学習率を求める。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 …
tanuki- 2022-07-08 nnue-pytorch NVLAMB 実験内容 nnue-pytorch を用いた学習で、 Optimizer を NVLAMB に変更して学習させた場合の、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの…
tanuki- 2022-07-04 nnue-pytorch RAdam 実験内容 nnue-pytorch を用いた学習で、 Optimizer を RAdam に変更して学習させた場合の、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思…
tanuki- 2022-07-03 強化学習 実験内容 「tanuki- 2022-06-07 やねうら王学習部リグレッション調査」で作成した評価関数が思いのほか強かったので、そこからの強化学習を行い、レーティングの変化を測定する。 https://docs.google.com/document/d/1Lup-hHFH…
tanuki- 2022-07-02 FV_SCALE 調整 実験内容 水匠 5 を用いて生成した学習データを用いて学習した評価関数で、 FV_SCALE の値を変化させたときの、レーティングの変化を調べる。 水匠 5 が、 FV_SCALE を変化させることでレーティングが変化するのであれば、…
tanuki- 2022-06-27 nnue-pytorch step と gamma の調整 実験内容 nnue-pytorch を用いた学習で、 StepLR の step と gamma を、 nnue-pytorch 本家最新版に変更し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5…
tanuki- 2022-06-27 nnue-pytorch halfkp_1024x2-8-32 実験内容 nnue-pytorch を用いた学習で、 halfkp_1024x2-8-32 を用いて学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …
tanuki- 2022-06-20 nnue-pytorch HalfKP^ 実験内容 nnue-pytorch を用いた学習で、 HalfKP^ (HalfKP + K 次元下げ + P 次元下げ) を用いて学習させ、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=…
tanuki- 2022-06-18 nnue-pytorch 勝敗項の教師信号 実験内容 nnue-pytorch を用いた学習で、 勝敗項の教師信号を変更し、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最…
tanuki- 2022-06-14 nnue-pytorch lambda 実験内容 nnue-pytorch を用いた学習で、 lambda の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード…
tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 scaling (kPonanzaConstant) の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考…