tanuki- 2022-07-04 nnue-pytorch RAdam

tanuki- 2022-07-04 nnue-pytorch RAdam 実験内容 nnue-pytorch を用いた学習で、 Optimizer を RAdam に変更して学習させた場合の、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思…

tanuki- 2022-07-03 強化学習

tanuki- 2022-07-03 強化学習 実験内容 「tanuki- 2022-06-07 やねうら王学習部リグレッション調査」で作成した評価関数が思いのほか強かったので、そこからの強化学習を行い、レーティングの変化を測定する。 https://docs.google.com/document/d/1Lup-hHFH…

tanuki- 2022-07-02 FV_SCALE 調整

tanuki- 2022-07-02 FV_SCALE 調整 実験内容 水匠 5 を用いて生成した学習データを用いて学習した評価関数で、 FV_SCALE の値を変化させたときの、レーティングの変化を調べる。 水匠 5 が、 FV_SCALE を変化させることでレーティングが変化するのであれば、…

tanuki- 2022-06-27 nnue-pytorch step と gamma の調整

tanuki- 2022-06-27 nnue-pytorch step と gamma の調整 実験内容 nnue-pytorch を用いた学習で、 StepLR の step と gamma を、 nnue-pytorch 本家最新版に変更し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5…

tanuki- 2022-06-27 nnue-pytorch halfkp_1024x2-8-32

tanuki- 2022-06-27 nnue-pytorch halfkp_1024x2-8-32 実験内容 nnue-pytorch を用いた学習で、 halfkp_1024x2-8-32 を用いて学習し、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 …

tanuki- 2022-06-20 nnue-pytorch HalfKP^

tanuki- 2022-06-20 nnue-pytorch HalfKP^ 実験内容 nnue-pytorch を用いた学習で、 HalfKP^ (HalfKP + K 次元下げ + P 次元下げ) を用いて学習させ、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=…

tanuki- 2022-06-18 nnue-pytorch 勝敗項の教師信号

tanuki- 2022-06-18 nnue-pytorch 勝敗項の教師信号 実験内容 nnue-pytorch を用いた学習で、 勝敗項の教師信号を変更し、レーティングの変化を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最…

tanuki- 2022-06-14 nnue-pytorch lambda

tanuki- 2022-06-14 nnue-pytorch lambda 実験内容 nnue-pytorch を用いた学習で、 lambda の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード…

tanuki- 2022-06-12 nnue-pytorch scaling

tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 scaling (kPonanzaConstant) の設定がレーティングに与える影響を調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考…

tanuki- 2022-06-11 nnue-pytorch max_epoch

tanuki- 2022-06-11 nnue-pytorch max_epoch 実験内容 nnue-pytorch を用いた学習で、 max_epoch の設定が学習結果に影響を及ぼすかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 …

tanuki- 2022-06-11 やねうら王学習部リグレッション調査 追試

tanuki- 2022-06-11 やねうら王学習部リグレッション調査 追試 実験内容 やねうら王の過去のバージョンのうち、学習部がどのタイミングでリグレッションを起こしたのか調べる。 特に、 V5.40 前後のレーティングを測定する。 棋譜生成 生成ルーチン tanuki-…

tanuki- 2022-06-07 nnue-pytorch 再実験

tanuki- 2022-06-07 nnue-pytorch 再実験 実験内容 nnue-pytorch にやねうら王をマージし、コンピューター将棋ソフト用の NNUE 評価関数を学習させ、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1…

tanuki- 2022-06-07 やねうら王学習部リグレッション調査

tanuki- 2022-06-07 やねうら王学習部リグレッション調査 実験内容 やねうら王の過去のバージョンのうち、学習部がどのタイミングでリグレッションを起こしたのか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あ…

tanuki- 2022-05-17 シャッフル時に置換表を有効にして qsearch を行う

tanuki- 2022-05-17 シャッフル時に置換表を有効にして qsearch を行う 実験内容 シャッフル時に置換表を有効にして qsearch を行った場合、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1…

tanuki- 2022-05-15 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習する

tanuki- 2022-05-15 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習する 実験内容 学習時に best move が駒を取る指し手でない局面のみ qsearch なしで学習し、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜…

tanuki- 2022-05-14 学習時に qsearch なしで学習後 qsearch ありで追加学習する

tanuki- 2022-05-14 学習時に qsearch なしで学習後 qsearch ありで追加学習する 実験内容 学習時に qsearch なしで学習後、 qsearch ありで追加学習し、レーティングが変化するか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV…

tanuki- 2022-05-13 学習時に qsearch を行わない

tanuki- 2022-05-13 学習時に qsearch を行わない 実験内容 学習時に qsearch を行わず、 evaluate のみを行い、学習が行えるかどうか確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思…

tanuki- 2022-05-12 シャッフル時にqsearch()を行う

tanuki- 2022-05-12 シャッフル時にqsearch()を行う 実験内容 学習データのシャッフル時に qsearch() を行い、学習時の qsearch() を省略し、正しく学習が行えるかどうか確認する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=…

tanuki- 2022-05-08 学習時のリビジョン 再実験2

tanuki- 2022-05-08 学習時のリビジョン 再実験2 実験内容 やねうら王 V7.10 相当で学習を行い、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …

第 32 回世界コンピュータ将棋選手権参加記録

本ブログエントリは、 2022 年 5 月 3 日~ 5 日に開催された、第 32 回世界コンピュータ将棋選手権の参加記録です。 マメット・ブンブク 今回の参加名は「マメット・ブンブク」でした。元ネタは FF14 で、利用者の将棋ライフのお供として、いつも寄り添う存…

tanuki- 2022-05-06 s-book_black レーティング測定

tanuki- 2022-05-06 s-book_black レーティング測定 実験内容 s-book_black のレーティングを測定した レーティング測定 対局相手 思考時間 持ち時間 300 秒 + 1 手 2 秒加算 対局数 2000 同時対局数 64 ハッシュサイズ 640 開始局面 平手局面 実験結果 レー…

tanuki- 2022-04-28 halfkp_1024x2-8-32

tanuki- 2022-04-28 halfkp_1024x2-8-32 実験内容 ネットワーク構成を halfkp_1024x2-8-32 に変更した場合に、レーティングに変化があるかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最…

tanuki- 2022-04-10 学習データ量 再実験2

tanuki- 2022-04-01 halfkp_256x2-32-32 再実験 実験内容 学習データ量を 40 億局面から 80 億局面に増やした場合に、レーティングに変化があるかどうか調べた。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考…

tanuki- 2022-04-01 halfkp_256x2-32-32 再実験

tanuki- 2022-04-01 halfkp_256x2-32-32 再実験 実験内容 ネットワーク構成を halfkp_256x2-32-32 (標準 NNUE) に戻し、レーティングに変化があるかどうか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思…

tanuki- 2022-03-30 学習データ量 再実験

tanuki- 2022-03-30 学習データ量 再実験 実験内容 学習データ量を増やした場合に、レーティングに変化があるかどうか調べた。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,…

tanuki- 2022-03-25 強い将棋ソフトの創りかた 学習データ配合

tanuki- 2022-03-25 強い将棋ソフトの創りかた 学習データ配合 実験内容 既存の学習データに「強い将棋ソフトの創りかた」に付属の学習データを配合し、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 F…

tanuki- 2022-03-23 勝敗項の教師信号 再実験4

tanuki- 2022-03-23 勝敗項の教師信号 再実験4 実験内容 勝敗項の教師信号を変更し、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …

tanuki- 2022-03-22 momentum

tanuki- 2022-03-22 momentum 実験内容 momentum を適用し、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード 開始局面 foodgate…

tanuki- 2022-03-17 warmup

tanuki- 2022-03-17 warmup 実験内容 warmup を行い、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード 開始局面 foodgate の 20…

tanuki- 2022-03-16 save_eval_interval

tanuki- 2022-03-16 save_eval_interval 実験内容 save_eval_interval を変化させ、レーティングに変化があるか調べる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 FV_SCALE=16 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノ…