コンピュータ将棋

tanuki- 2022-11-03 nnue-pytorch halfkp_1024x2-8-32

tanuki- 2022-11-03 nnue-pytorch halfkp_1024x2-8-32 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード…

tanuki- 2022-10-31 nnue-pytorch やねうら王学習率スケジューラー

tanuki- 2022-10-31 nnue-pytorch やねうら王学習率スケジューラー 実験内容 nnue-pytorch を用いた学習で、 やねうら王に実装されている newbob 風学習率スケジューラーを用いて学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5…

tanuki- 2022-10-27 nnue-pytorch Label Smoothing

tanuki- 2022-10-27 nnue-pytorch Label Smoothing 実験内容 nnue-pytorch を用いた学習で、 Label Smoothing を適用し、リグレッションがないことを確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …

tanuki- 2022-10-26 nnue-pytorch GeForce RTX 4090

tanuki- 2022-10-26 nnue-pytorch GeForce RTX 4090 実験内容 nnue-pytorch を用いた学習で、 GeForce RTX 4090 を用い、リグレッションがないことを確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …

tanuki- 2022-08-05 教師局面生成時の開始局面 (s-book_black) (3)

tanuki- 2022-08-05 教師局面生成時の開始局面 (s-book_black) (3) 実験内容 教師局面の生成時、開始局面として floodgate の棋譜の局面と、 s-book_black に収録されている局面を使用し、学習した評価関数のレーティングを計測する。 棋譜生成 生成ルーチン…

tanuki- 2022-08-01 教師局面生成時の開始局面 (s-book_black) (2)

tanuki- 2022-08-01 教師局面生成時の開始局面 (s-book_black) (2) 実験内容 教師局面の生成時、開始局面として s-book_black に収録されている局面を使用し、学習した評価関数のレーティングを計測する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評…

tanuki- 2022-07-26 やねうら王学習部リグレッション調査 再追試

tanuki- 2022-07-26 やねうら王学習部リグレッション調査 再追試 実験内容 やねうら王最新版の qsearch() 内の move count に関する枝刈りを無効化し、評価関数を学習し、 V5.33 で学習したものと比較する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン …

tanuki- 2022-07-21 tanuki- 学習部 リビジョン変更 (2)

tanuki- 2022-07-21 tanuki- 学習部 リビジョン変更 (2) 実験内容 tanuki- の学習部を、やねうら王 V5.33 に変更し、勝敗項の教師信号を 1.0 に設定し、評価関数を学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数…

tanuki- 2022-07-20 tanuki- 学習部 リビジョン変更

tanuki- 2022-07-20 tanuki- 学習部 リビジョン変更 実験内容 tanuki- の学習部を、やねうら王 V5.33 に変更し、評価関数を学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠 5 FV_SCALE=16 1手あたりの思考 …

tanuki- 2022-07-18 tanuki- 学習部 リグレッション調査 (2)

tanuki- 2022-07-18 tanuki- 学習部 リグレッション調査 (2) 実験内容 前回の実験で、シャッフル時の qsearch をしていなかったため、 qsearch を行ったうえで、再度学習器にリグレッションがないかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ル…

tanuki- 2022-07-16 tanuki- 学習部 リグレッション調査

tanuki- 2022-07-16 tanuki- 学習部 リグレッション調査 実験内容 前回の実験結果に不審な点があったため、 tanuki- 学習部にリグレッションがないか確認する。 https://docs.google.com/document/d/12PFODs6RGkAtILO9BxvVSRRsY80nwqYxJz-HO05VH5I/edit?usp=…

tanuki- 2022-07-13 nnue-pytorch 学習率調整 (2)

tanuki- 2022-07-13 nnue-pytorch 学習率調整 (2) 実験内容 nnue-pytorch を用いた学習で、学習率を 0.00025 に設定し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思…

tanuki- 2022-07-12 教師局面生成時の開始局面 (s-book_black)

tanuki- 2022-07-12 教師局面生成時の開始局面 (s-book_black) 実験内容 教師局面の生成時、開始局面として s-book_black に収録されている局面を使用し、学習した評価関数のレーティングを計測する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関…

tanuki- 2022-07-10 nnue-pytorch 学習率調整

tanuki- 2022-07-10 nnue-pytorch 学習率調整 実験内容 nnue-pytorch を用いた学習で、いくつかの学習率を試し、最もロスが下がる学習率を求める。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 …

tanuki- 2022-07-08 nnue-pytorch NVLAMB

tanuki- 2022-07-08 nnue-pytorch NVLAMB 実験内容 nnue-pytorch を用いた学習で、 Optimizer を NVLAMB に変更して学習させた場合の、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの…

tanuki- 2022-07-04 nnue-pytorch RAdam

tanuki- 2022-07-04 nnue-pytorch RAdam 実験内容 nnue-pytorch を用いた学習で、 Optimizer を RAdam に変更して学習させた場合の、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思…

tanuki- 2022-07-03 強化学習

tanuki- 2022-07-03 強化学習 実験内容 「tanuki- 2022-06-07 やねうら王学習部リグレッション調査」で作成した評価関数が思いのほか強かったので、そこからの強化学習を行い、レーティングの変化を測定する。 https://docs.google.com/document/d/1Lup-hHFH…

tanuki- 2022-07-02 FV_SCALE 調整

tanuki- 2022-07-02 FV_SCALE 調整 実験内容 水匠 5 を用いて生成した学習データを用いて学習した評価関数で、 FV_SCALE の値を変化させたときの、レーティングの変化を調べる。 水匠 5 が、 FV_SCALE を変化させることでレーティングが変化するのであれば、…

tanuki- 2022-06-27 nnue-pytorch halfkp_1024x2-8-32

tanuki- 2022-06-27 nnue-pytorch halfkp_1024x2-8-32 実験内容 nnue-pytorch を用いた学習で、 halfkp_1024x2-8-32 を用いて学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …

tanuki- 2022-06-27 nnue-pytorch step と gamma の調整

tanuki- 2022-06-27 nnue-pytorch step と gamma の調整 実験内容 nnue-pytorch を用いた学習で、 StepLR の step と gamma を、 nnue-pytorch 本家最新版に変更し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5…

tanuki- 2022-06-20 nnue-pytorch HalfKP^

tanuki- 2022-06-20 nnue-pytorch HalfKP^ 実験内容 nnue-pytorch を用いた学習で、 HalfKP^ (HalfKP + K 次元下げ + P 次元下げ) を用いて学習させ、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=…

tanuki- 2022-06-18 nnue-pytorch 勝敗項の教師信号

tanuki- 2022-06-18 nnue-pytorch 勝敗項の教師信号 実験内容 nnue-pytorch を用いた学習で、 勝敗項の教師信号を変更し、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最…

tanuki- 2022-06-14 nnue-pytorch lambda

tanuki- 2022-06-14 nnue-pytorch lambda 実験内容 nnue-pytorch を用いた学習で、 lambda の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード…

tanuki- 2022-06-12 nnue-pytorch scaling

tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 scaling (kPonanzaConstant) の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考…

tanuki- 2022-06-11 やねうら王学習部リグレッション調査 追試

tanuki- 2022-06-11 やねうら王学習部リグレッション調査 追試 実験内容 やねうら王の過去のバージョンのうち、学習部がどのタイミングでリグレッションを起こしたのか調べる。 特に、 V5.40 前後のレーティングを測定する。 棋譜生成 生成ルーチン tanuki-…

tanuki- 2022-06-11 nnue-pytorch max_epoch

tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 max_epoch の設定が学習結果に影響を及ぼすかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 …

tanuki- 2022-06-07 やねうら王学習部リグレッション調査

tanuki- 2022-06-07 やねうら王学習部リグレッション調査 実験内容 やねうら王の過去のバージョンのうち、学習部がどのタイミングでリグレッションを起こしたのか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あ…

tanuki- 2022-06-07 nnue-pytorch 再実験

tanuki- 2022-06-07 nnue-pytorch 再実験 実験内容 nnue-pytorch にやねうら王をマージし、コンピューター将棋ソフト用の NNUE 評価関数を学習させ、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1…

tanuki- 2022-05-17 シャッフル時に置換表を有効にして qsearch を行う

tanuki- 2022-05-17 シャッフル時に置換表を有効にして qsearch を行う 実験内容 シャッフル時に置換表を有効にして qsearch を行った場合、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1…

tanuki- 2022-05-15 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習する

tanuki- 2022-05-15 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習する 実験内容 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習し、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜…