コンピュータ将棋
tanuki- 2022-07-04 nnue-pytorch RAdam 実験内容 nnue-pytorch を用いた学習で、 Optimizer を RAdam に変更して学習させた場合の、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思…
tanuki- 2022-07-03 強化学習 実験内容 「tanuki- 2022-06-07 やねうら王学習部リグレッション調査」で作成した評価関数が思いのほか強かったので、そこからの強化学習を行い、レーティングの変化を測定する。 https://docs.google.com/document/d/1Lup-hHFH…
tanuki- 2022-07-02 FV_SCALE 調整 実験内容 水匠 5 を用いて生成した学習データを用いて学習した評価関数で、 FV_SCALE の値を変化させたときの、レーティングの変化を調べる。 水匠 5 が、 FV_SCALE を変化させることでレーティングが変化するのであれば、…
tanuki- 2022-06-27 nnue-pytorch halfkp_1024x2-8-32 実験内容 nnue-pytorch を用いた学習で、 halfkp_1024x2-8-32 を用いて学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …
tanuki- 2022-06-27 nnue-pytorch step と gamma の調整 実験内容 nnue-pytorch を用いた学習で、 StepLR の step と gamma を、 nnue-pytorch 本家最新版に変更し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5…
tanuki- 2022-06-20 nnue-pytorch HalfKP^ 実験内容 nnue-pytorch を用いた学習で、 HalfKP^ (HalfKP + K 次元下げ + P 次元下げ) を用いて学習させ、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=…
tanuki- 2022-06-18 nnue-pytorch 勝敗項の教師信号 実験内容 nnue-pytorch を用いた学習で、 勝敗項の教師信号を変更し、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最…
tanuki- 2022-06-14 nnue-pytorch lambda 実験内容 nnue-pytorch を用いた学習で、 lambda の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード…
tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 scaling (kPonanzaConstant) の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考…
tanuki- 2022-06-11 やねうら王学習部リグレッション調査 追試 実験内容 やねうら王の過去のバージョンのうち、学習部がどのタイミングでリグレッションを起こしたのか調べる。 特に、 V5.40 前後のレーティングを測定する。 棋譜生成 生成ルーチン tanuki-…
tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 max_epoch の設定が学習結果に影響を及ぼすかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 …
tanuki- 2022-06-07 やねうら王学習部リグレッション調査 実験内容 やねうら王の過去のバージョンのうち、学習部がどのタイミングでリグレッションを起こしたのか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あ…
tanuki- 2022-06-07 nnue-pytorch 再実験 実験内容 nnue-pytorch にやねうら王をマージし、コンピューター将棋ソフト用の NNUE 評価関数を学習させ、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1…
tanuki- 2022-05-17 シャッフル時に置換表を有効にして qsearch を行う 実験内容 シャッフル時に置換表を有効にして qsearch を行った場合、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1…
tanuki- 2022-05-15 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習する 実験内容 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習し、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜…
tanuki- 2022-05-14 学習時に qsearch なしで学習後 qsearch ありで追加学習する 実験内容 学習時に qsearch なしで学習後、 qsearch ありで追加学習し、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV…
tanuki- 2022-05-13 学習時に qsearch を行わない 実験内容 学習時に qsearch を行わず、 evaluate のみを行い、学習が行えるかどうか確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思…
tanuki- 2022-05-12 シャッフル時にqsearch()を行う 実験内容 学習データのシャッフル時に qsearch() を行い、学習時の qsearch() を省略し、正しく学習が行えるかどうか確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=…
tanuki- 2022-05-08 学習時のリビジョン 再実験2 実験内容 やねうら王 V7.10 相当で学習を行い、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …
tanuki- 2022-05-06 s-book_black レーティング測定 実験内容 s-book_black のレーティングを測定した レーティング測定 対局相手 思考時間 持ち時間 300 秒 + 1 手 2 秒加算 対局数 2000 同時対局数 64 ハッシュサイズ 640 開始局面 平手局面 実験結果 レー…
tanuki- 2022-04-28 halfkp_1024x2-8-32 実験内容 ネットワーク構成を halfkp_1024x2-8-32 に変更した場合に、レーティングに変化があるかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最…
tanuki- 2022-04-01 halfkp_256x2-32-32 再実験 実験内容 学習データ量を 40 億局面から 80 億局面に増やした場合に、レーティングに変化があるかどうか調べた。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考…
tanuki- 2022-04-01 halfkp_256x2-32-32 再実験 実験内容 ネットワーク構成を halfkp_256x2-32-32 (標準 NNUE) に戻し、レーティングに変化があるかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思…
tanuki- 2022-03-30 学習データ量 再実験 実験内容 学習データ量を増やした場合に、レーティングに変化があるかどうか調べた。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,…
tanuki- 2022-03-25 強い将棋ソフトの創りかた 学習データ配合 実験内容 既存の学習データに「強い将棋ソフトの創りかた」に付属の学習データを配合し、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 F…
tanuki- 2022-03-23 勝敗項の教師信号 再実験4 実験内容 勝敗項の教師信号を変更し、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …
tanuki- 2022-03-22 momentum 実験内容 momentum を適用し、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード 開始局面 foodgate…
tanuki- 2022-03-17 warmup 実験内容 warmup を行い、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード 開始局面 foodgate の 20…
tanuki- 2022-03-16 save_eval_interval 実験内容 save_eval_interval を変化させ、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノ…
tanuki- 2022-03-06 棋譜生成時の開始手数 3 実験内容 棋譜生成時の開始手数の最大値を 40 に設定した場合、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=24 1手あたりの思考 深さ最大 9 思…