nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

2025-01-01から1年間の記事一覧

tanuki- 2025-12-27 SFNNwoP1536 SGD+Momentum

tanuki- 2025-12-27 SFNNwoP1536 SGD+Momentum 実験内容 ネットワークアーキテクチャーに SFNNwoP1536 を使用する。 学習手法に SGD+Momentum を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手…

tanuki- 2025-12-24 SFNNwoP1536

tanuki- 2025-12-24 SFNNwoP1536 実験内容 ネットワークアーキテクチャーに SFNNwoP1536 を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノ…

tanuki- 2025-12-20 Policy による学習データ生成 採択率の下限

tanuki- 2025-12-20 Policy による学習データ生成 採択率の下限 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 指し手採択率の下限を 0.1 とした。 採択率の下限を上回る指し手が存在しない場合、採択率に 0.5 を掛けて…

tanuki- 2025-12-14 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (3)

tanuki- 2025-12-01 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (3) 実験内容 アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。 知識蒸留には以下のモデルを使用する。 DL 水匠 (dls…

tanuki- 2025-11-25 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (2)

tanuki- 2025-11-25 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (2) 実験内容 アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。 知識蒸留には以下のモデルを使用する。 DL 水匠 (dls…

tanuki- 2025-11-17 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する

tanuki- 2025-11-17 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する 実験内容 アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。 知識蒸留には以下のモデルを使用する。 DL 水匠 (dlsuish…

tanuki- 2025-11-08 棋譜生成 nodes=500

tanuki- 2025-11-08 棋譜生成 nodes=500 実験内容 学習データの生成に CPU エンジンを使用する。 探索ノード数を 500 とする。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 (dlsuisho…

tanuki- 2025-10-28 棋譜生成 nodes=1000

tanuki- 2025-10-28 棋譜生成 nodes=1000 実験内容 学習データの生成に CPU エンジンを使用する。 探索ノード数を 1000 とする。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 (dlsuis…

tanuki- 2025-10-15 Policy による学習データ生成 Softmax_Temperature=50

tanuki- 2025-10-15 Policy による学習データ生成 Softmax_Temperature=50 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデル…

tanuki- 2025-10-03 Policy による学習データ生成 Softmax_Temperature=100

tanuki- 2025-10-03 Policy による学習データ生成 Softmax_Temperature=100 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデ…

tanuki- 2025-09-21 Policy による学習データ生成

tanuki- 2025-09-21 Policy による学習データ生成 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 (d…

tanuki- 2025-08-23 halfkp_1024x2-8-96 ステージ 2

tanuki- 2025-08-23 halfkp_1024x2-8-96 ステージ 2 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネ…

tanuki- 2025-08-13 halfkp_1536x2-8-96

tanuki- 2025-08-13 halfkp_1536x2-8-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

tanuki- 2025-08-07 halfkp_1024x2-8-96

tanuki- 2025-08-07 halfkp_1024x2-8-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

tanuki- 2025-08-02 halfkp_768x2-8-96

tanuki- 2025-08-02 halfkp_768x2-8-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

tanuki- 2025-07-24 halfkp_512x2-8-128

tanuki- 2025-07-24 halfkp_512x2-8-128 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

tanuki- 2025-07-20 halfkp_512x2-16-96

tanuki- 2025-07-20 halfkp_512x2-16-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

tanuki- 2025-07-16 知識蒸留 棋譜追加

tanuki- 2025-07-16 知識蒸留 棋譜追加 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 電竜戦TSEC指定…

tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35

tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20250407_235846_model_resnet30x384_relu_06…

tanuki- 2025-06-22 知識蒸留 qsearch あり+なし

tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …

tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル

tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …

tanuki- 2025-06-14 知識蒸留 qsearch なし

tanuki- 2025-06-14 知識蒸留 qsearch なし 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に qsearch を行わない…

tanuki- 2025-06-02 知識蒸留 重複した局面を取り除く

tanuki- 2025-06-02 知識蒸留 重複した局面を取り除く 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 重複した局面を取り除く…

tanuki- 2025-05-29 知識蒸留 mate の値はそのまま学習する

tanuki- 2025-05-29 知識蒸留 mate の値はそのままにする 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 学習データの mate の…

tanuki- 2025-05-25 知識蒸留 Ranger

tanuki- 2025-05-25 知識蒸留 Ranger 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Optimizer に Ranger を使用する。 棋譜生…

tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade

tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Kanade_p8 棋譜生成…

tanuki- 2025-05-17 知識蒸留 Kanade

tanuki- 2025-05-17 知識蒸留 Kanade 実験内容 知識蒸留を行う。 教師モデルには Kanade_p8 を使用した。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …

tanuki- 2025-05-08 知識蒸留 score_scaling=723

tanuki- 2025-05-08 知識蒸留 score_scaling=723 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 score_scaling に 723 を設定…

tanuki- 2025-05-01 知識蒸留 DL 水匠 + AobaZero

tanuki- 2025-05-01 知識蒸留 アンサンブル DL 水匠 + AobaZero 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 棋譜生成 生成…

tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2)

tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2) 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を AobaZero で付けなおし、学習させ、レーティングを測定する。 前回の実験で score_scaling が意図せず 361 になって…