nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

コンピュータ将棋

tanuki- 2024-04-12 halfkp_256x2-256-256-256

tanuki- 2024-04-12 halfkp_256x2-256-256-256 実験内容 halfkp_256x2-256-256-256 ネットワークを学習させ、レーティングを測定する。 ランダムパラメーターからの学習には、 Hao を用いて生成した学習データを用いる。 Fine-tuning に Fine-tuning Suisho1…

tanuki- 2024-04-09 halfkp_256x2-256-256

tanuki- 2024-04-09 halfkp_256x2-256-256 実験内容 halfkp_256x2-256-256 ネットワークを学習させ、レーティングを測定する。 ランダムパラメーターからの学習には、 Hao を用いて生成した学習データを用いる。 Fine-tuning に Fine-tuning Suisho10Mn_psv …

tanuki- 2024-04-06 halfkp_1280x2-16-32 思考時間

tanuki- 2024-04-04 halfkp_1280x2-16-32 実験内容 halfkp_1280x2-16-32 ネットワークについて、思考時間によりレーティングが変化するかどうか調べる。 棋譜生成 ランダムパラメーターから学習させる際の学習データ 生成ルーチン tanuki-棋譜生成ルーチン …

tanuki- 2024-04-04 halfkp_1280x2-16-32

tanuki- 2024-04-04 halfkp_1280x2-16-32 実験内容 halfkp_1280x2-16-32 ネットワークを学習させ、レーティングを測定する。 ランダムパラメーターからの学習には、 Hao を用いて生成した学習データを用いる。 Fine-tuning に Fine-tuning Suisho10Mn_psv を…

tanuki- 2024-03-31 halfkp_1024x2-16-32

tanuki- 2024-03-31 halfkp_1024x2-16-32 実験内容 halfkp_1024x2-16-32 ネットワークを学習させ、レーティングを測定する。 ランダムパラメーターからの学習には、 Hao を用いて生成した学習データを用いる。 Fine-tuning に Fine-tuning Suisho10Mn_psv を…

tanuki- 2024-03-27 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv (3)

tanuki- 2024-03-23 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv (2) 実験内容 nnue-pytorch で学習した halfkp_1024x2-8-32 ネットワークを、 Suisho10Mn_psv を用いて Fine-tuning する。 学習率を 1e-6 または 1e-7 とし、学習局面数を…

tanuki- 2024-03-23 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv (2)

tanuki- 2024-03-23 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv (2) 実験内容 nnue-pytorch で学習した halfkp_1024x2-8-32 ネットワークを、 Suisho10Mn_psv を用いて Fine-tuning する。 学習率を変えて学習させる。 シャッフル条件 生…

tanuki- 2024-03-20 halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv

tanuki- 2024-03-20 halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv 実験内容 nnue-pytorch で学習した halfkp_1024x2-8-32 ネットワークを、 Suisho10Mn_psv を用いて、やねうら王純正の学習器を用いて Fine-tuning する。 シャッフル条件 生成ルーチン ta…

tanuki- 2024-03-18 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv

tanuki- 2024-03-18 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suisho10Mn_psv 実験内容 nnue-pytorch で学習した halfkp_1024x2-8-32 ネットワークを、 Suisho10Mn_psv を用いて Fine-tuning する。 シャッフル条件 生成ルーチン tanuki-シャッフルルー…

tanuki- 2024-03-15 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suishopsv-150m

tanuki- 2024-03-15 nnue-pytorch halfkp_1024x2-8-32 Fine-tuning Suishopsv-150m 実験内容 nnue-pytorch で学習した halfkp_1024x2-8-32 ネットワークを、 Suishopsv-150m を用いて Fine-tuning する。 シャッフル条件 生成ルーチン tanuki-シャッフルルー…

tanuki- 2024-03-07 nnue-pytorch halfkp_1024x2-8-32 バッチサイズ調整

tanuki- 2024-03-07 nnue-pytorch halfkp_1024x2-8-32 バッチサイズ調整 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 バッチサイズを 16384 に増やして学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価…

tanuki- 2024-03-01 nnue-pytorch halfkp_1024x2-8-32 水匠 5 で生成した入玉将棋の棋譜の混合

tanuki- 2024-03-01 nnue-pytorch halfkp_1024x2-8-32 水匠 5 で生成した入玉将棋の棋譜の混合 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 Hao で生成した学習データに、水匠 5 で生成した学習データを混合する。 水匠 …

tanuki- 2024-02-21 nnue-pytorch halfkp_1024x2-8-32 入玉ボーナス (2)

tanuki- 2024-02-21 nnue-pytorch halfkp_1024x2-8-32 入玉ボーナス (2) 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 学習データの読み込み時、入玉していた場合の評価値のボーナスを、前回の 2 倍にする。 入玉時、持ち…

tanuki- 2024-02-14 nnue-pytorch halfkp_1024x2-8-32 入玉ボーナス

tanuki- 2024-02-14 nnue-pytorch halfkp_1024x2-8-32 入玉ボーナス 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 学習データの読み込み時、入玉していた場合に評価値にボーナスを追加する。 入玉時、持ち駒および敵陣三…

tanuki- 2024-02-06 nnue-pytorch halfkp_1024x2-8-32 学習データ比較

tanuki- 2024-02-06 nnue-pytorch halfkp_1024x2-8-32 学習データ比較 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 Hao を使用して生成した学習データで学習する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価…

tanuki- 2024-01-29 nnue-pytorch halfkp_1024x2-8-32 lambda を変更して Fine-tuning

tanuki- 2024-01-29 nnue-pytorch halfkp_1024x2-8-32 lambda を変更して Fine-tuning 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 はじめに lambda=1.0 に設定して学習させ、収束後に lambda=0.5 に設定して Fine-Tunin…

tanuki- 2024-01-21 nnue-pytorch halfkp_1024x2-8-32 Adam

tanuki- 2024-01-21 nnue-pytorch halfkp_1024x2-8-32 Adam 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 最適化手法として Adam を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 1手あたり…

tanuki- 2024-01-16 nnue-pytorch halfkp_1024x2-8-32 モーメンタム

tanuki- 2024-01-16 nnue-pytorch halfkp_1024x2-8-32 モーメンタム 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 学習の際、モーメンタムを使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 1…

tanuki- 2024-01-10 nnue-pytorch halfkp_1024x2-8-32 勾配の正規化

tanuki- 2024-01-10 nnue-pytorch halfkp_1024x2-8-32 勾配の正規化 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 勾配を平均 0 標準偏差 0 に正規化して学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評…

tanuki- 2024-01-03 nnue-pytorch halfkp_1024x2-8-32 Gradient Centralization

tanuki- 2024-01-03 nnue-pytorch halfkp_1024x2-8-32 Gradient Centralization 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 勾配に対し Gradient Centralization を適用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ル…

tanuki- 2023-12-31 nnue-pytorch halfkp_1024x2-8-32 LAMB

tanuki- 2023-12-31 nnue-pytorch halfkp_1024x2-8-32 LAMB 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 Optimizer に LAMB を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 1手あたりの思…

tanuki- 2023-12-23 nnue-pytorch halfkp_1024x2-8-32 学習率調整

tanuki- 2023-12-23 nnue-pytorch halfkp_1024x2-8-32 学習率調整 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 学習率を 2.0 に設定し、学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠5 1手…

tanuki- 2023-12-20 nnue-pytorch halfkp_1024x2-8-32 バッチサイズ調整

tanuki- 2023-12-20 nnue-pytorch halfkp_1024x2-8-32 バッチサイズ調整 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 バッチサイズを 8192 に設定し、学習させる。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価…

tanuki- 2023-12-17 nnue-pytorch halfkp_1024x2-8-32 ネットワークパラメーターのバックアップとリストア

tanuki- 2023-12-17 nnue-pytorch halfkp_1024x2-8-32 ネットワークパラメーターのバックアップとリストア 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 ある学習率で収束したかどうかの判定の際、収束していない場合はネ…

tanuki- 2023-12-14 nnue-pytorch halfkp_1024x2-8-32 epoch-size 調整 (2)

tanuki- 2023-12-14 nnue-pytorch halfkp_1024x2-8-32 epoch-size 調整 (2) 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 epoch-size を 100 万、 num-epochs-to-adjust-lr を 500 に設定し、学習させる。 棋譜生成 生成…

tanuki- 2023-12-11 nnue-pytorch halfkp_1024x2-8-32 epoch-size 調整

tanuki- 2023-12-11 nnue-pytorch halfkp_1024x2-8-32 epoch-size 調整 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 epoch-size を 1 億、 num-epochs-to-adjust-lr を 5 に設定し、学習させる。 棋譜生成 生成ルーチン …

tanuki- 2023-12-09 nnue-pytorch halfkp_1024x2-8-32 in_scaling/out_scaling

tanuki- 2023-12-09 nnue-pytorch halfkp_1024x2-8-32 in_scaling/out_scaling 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 評価値を勝率に変換する際の定数のうち、ネットワークの出力側を 340、教師局面が和を 380 に…

tanuki- 2023-12-07 nnue-pytorch halfkp_1024x2-8-32 scaling 再実験

tanuki- 2023-12-07 nnue-pytorch halfkp_1024x2-8-32 scaling 再実験 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 評価値を勝率に変換する際の定数を 361 に設定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン …

tanuki- 2023-12-04 nnue-pytorch halfkp_1024x2-8-32 ReduceLROnPlateau

tanuki- 2023-12-04 nnue-pytorch halfkp_1024x2-8-32 ReduceLROnPlateau 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 学習率スケジューラーに ReduceLROnPlateau を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ル…

tanuki- 2023-12-02 nnue-pytorch halfkp_1024x2-8-32 重みのクリップ 再実験

tanuki- 2023-12-02 nnue-pytorch halfkp_1024x2-8-32 重みのクリップ 再実験 実験内容 nnue-pytorch を用い、 halfkp_1024x2-8-32 ネットワークを学習させる。 学習中、ネットワークパラメーターのうち、重みをクリップする。 重みの初期化に、 pytorch の…