tanuki- 2025-12-27 SFNNwoP1536 SGD+Momentum

将棋コンピュータ将棋

tanuki- 2025-12-27 SFNNwoP1536 SGD+Momentum 実験内容ネットワークアーキテクチャーに SFNNwoP1536 を使用する。学習手法に SGD+Momentum を使用する。棋譜生成生成ルーチン tanuki-棋譜生成ルーチン評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手…

2025-12-24

tanuki- 2025-12-24 SFNNwoP1536

将棋コンピュータ将棋

tanuki- 2025-12-24 SFNNwoP1536 実験内容ネットワークアーキテクチャーに SFNNwoP1536 を使用する。棋譜生成生成ルーチン tanuki-棋譜生成ルーチン評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考深さ最大 9 思考ノード数最大 50,000 ノ…

2025-12-20

tanuki- 2025-12-20 Policy による学習データ生成採択率の下限

将棋コンピュータ将棋

tanuki- 2025-12-20 Policy による学習データ生成採択率の下限実験内容学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。指し手採択率の下限を 0.1 とした。採択率の下限を上回る指し手が存在しない場合、採択率に 0.5 を掛けて…

2025-12-14

tanuki- 2025-12-14 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (3)

将棋コンピュータ将棋

tanuki- 2025-12-01 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (3) 実験内容アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。知識蒸留には以下のモデルを使用する。 DL 水匠 (dls…

2025-11-25

tanuki- 2025-11-25 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (2)

将棋コンピュータ将棋

tanuki- 2025-11-25 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (2) 実験内容アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。知識蒸留には以下のモデルを使用する。 DL 水匠 (dls…

2025-11-17

tanuki- 2025-11-17 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する

将棋コンピュータ将棋

tanuki- 2025-11-17 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する実験内容アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。知識蒸留には以下のモデルを使用する。 DL 水匠 (dlsuish…

2025-11-08

tanuki- 2025-11-08 棋譜生成 nodes=500

将棋コンピュータ将棋

tanuki- 2025-11-08 棋譜生成 nodes=500 実験内容学習データの生成に CPU エンジンを使用する。探索ノード数を 500 とする。生成後、知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 (dlsuisho…

2025-10-28

tanuki- 2025-10-28 棋譜生成 nodes=1000

将棋コンピュータ将棋

tanuki- 2025-10-28 棋譜生成 nodes=1000 実験内容学習データの生成に CPU エンジンを使用する。探索ノード数を 1000 とする。生成後、知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 (dlsuis…

2025-10-15

tanuki- 2025-10-15 Policy による学習データ生成 Softmax_Temperature=50

将棋コンピュータ将棋

tanuki- 2025-10-15 Policy による学習データ生成 Softmax_Temperature=50 実験内容学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。生成後、知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデル…

2025-10-03

tanuki- 2025-10-03 Policy による学習データ生成 Softmax_Temperature=100

将棋コンピュータ将棋

tanuki- 2025-10-03 Policy による学習データ生成 Softmax_Temperature=100 実験内容学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。生成後、知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデ…

2025-09-21

tanuki- 2025-09-21 Policy による学習データ生成

将棋コンピュータ将棋

tanuki- 2025-09-21 Policy による学習データ生成実験内容学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。生成後、知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 (d…

2025-08-23

tanuki- 2025-08-23 halfkp_1024x2-8-96 ステージ 2

将棋コンピュータ将棋

tanuki- 2025-08-23 halfkp_1024x2-8-96 ステージ 2 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネ…

2025-08-13

tanuki- 2025-08-13 halfkp_1536x2-8-96

将棋コンピュータ将棋

tanuki- 2025-08-13 halfkp_1536x2-8-96 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

2025-08-07

tanuki- 2025-08-07 halfkp_1024x2-8-96

将棋コンピュータ将棋

tanuki- 2025-08-07 halfkp_1024x2-8-96 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

2025-08-02

tanuki- 2025-08-02 halfkp_768x2-8-96

将棋コンピュータ将棋

tanuki- 2025-08-02 halfkp_768x2-8-96 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

2025-07-24

tanuki- 2025-07-24 halfkp_512x2-8-128

将棋コンピュータ将棋

tanuki- 2025-07-24 halfkp_512x2-8-128 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

2025-07-20

tanuki- 2025-07-20 halfkp_512x2-16-96

将棋コンピュータ将棋

tanuki- 2025-07-20 halfkp_512x2-16-96 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…

2025-07-16

tanuki- 2025-07-16 知識蒸留棋譜追加

将棋コンピュータ将棋

tanuki- 2025-07-16 知識蒸留棋譜追加実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 電竜戦TSEC指定…

2025-07-02

tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35

将棋コンピュータ将棋

tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20250407_235846_model_resnet30x384_relu_06…

2025-06-22

tanuki- 2025-06-22 知識蒸留 qsearch あり+なし

将棋コンピュータ将棋

tanuki- 2025-06-22 知識蒸留 qsearch あり+なしアンサンブル実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …

2025-06-22

tanuki- 2025-06-22 知識蒸留 qsearch あり+なしアンサンブル

将棋コンピュータ将棋

tanuki- 2025-06-22 知識蒸留 qsearch あり+なしアンサンブル実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …

2025-06-14

tanuki- 2025-06-14 知識蒸留 qsearch なし

将棋コンピュータ将棋

tanuki- 2025-06-14 知識蒸留 qsearch なし実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に qsearch を行わない…

2025-06-02

tanuki- 2025-06-02 知識蒸留重複した局面を取り除く

将棋コンピュータ将棋

tanuki- 2025-06-02 知識蒸留重複した局面を取り除く実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 重複した局面を取り除く…

2025-05-29

tanuki- 2025-05-29 知識蒸留 mate の値はそのまま学習する

将棋コンピュータ将棋

tanuki- 2025-05-29 知識蒸留 mate の値はそのままにする実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 学習データの mate の…

2025-05-25

tanuki- 2025-05-25 知識蒸留 Ranger

将棋コンピュータ将棋

tanuki- 2025-05-25 知識蒸留 Ranger 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Optimizer に Ranger を使用する。棋譜生…

2025-05-22

tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade

将棋コンピュータ将棋

tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Kanade_p8 棋譜生成…

2025-05-17

tanuki- 2025-05-17 知識蒸留 Kanade

将棋コンピュータ将棋

tanuki- 2025-05-17 知識蒸留 Kanade 実験内容知識蒸留を行う。教師モデルには Kanade_p8 を使用した。棋譜生成生成ルーチン tanuki-棋譜生成ルーチン評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考深さ最大 9 思考ノード数最大 50,000 …

2025-05-08

tanuki- 2025-05-08 知識蒸留 score_scaling=723

将棋コンピュータ将棋

tanuki- 2025-05-08 知識蒸留 score_scaling=723 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 score_scaling に 723 を設定…

2025-05-01

tanuki- 2025-05-01 知識蒸留 DL 水匠 + AobaZero

将棋コンピュータ将棋

tanuki- 2025-05-01 知識蒸留アンサンブル DL 水匠 + AobaZero 実験内容知識蒸留を行う。複数の教師モデルをアンサンブルする。アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 棋譜生成生成…

2025-04-26

tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2)

将棋コンピュータ将棋

tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2) 実験内容学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を AobaZero で付けなおし、学習させ、レーティングを測定する。前回の実験で score_scaling が意図せず 361 になって…

nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

2025-01-01から1年間の記事一覧

tanuki- 2025-12-27 SFNNwoP1536 SGD+Momentum

tanuki- 2025-12-24 SFNNwoP1536

tanuki- 2025-12-20 Policy による学習データ生成採択率の下限

tanuki- 2025-12-14 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (3)

tanuki- 2025-11-25 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (2)

tanuki- 2025-11-17 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する

tanuki- 2025-11-08 棋譜生成 nodes=500

tanuki- 2025-10-28 棋譜生成 nodes=1000

tanuki- 2025-10-15 Policy による学習データ生成 Softmax_Temperature=50

tanuki- 2025-10-03 Policy による学習データ生成 Softmax_Temperature=100

tanuki- 2025-09-21 Policy による学習データ生成

tanuki- 2025-08-23 halfkp_1024x2-8-96 ステージ 2

tanuki- 2025-08-13 halfkp_1536x2-8-96

tanuki- 2025-08-07 halfkp_1024x2-8-96

tanuki- 2025-08-02 halfkp_768x2-8-96

tanuki- 2025-07-24 halfkp_512x2-8-128

tanuki- 2025-07-20 halfkp_512x2-16-96

tanuki- 2025-07-16 知識蒸留棋譜追加

tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35

tanuki- 2025-06-22 知識蒸留 qsearch あり+なし

tanuki- 2025-06-22 知識蒸留 qsearch あり+なしアンサンブル

tanuki- 2025-06-14 知識蒸留 qsearch なし

tanuki- 2025-06-02 知識蒸留重複した局面を取り除く

tanuki- 2025-05-29 知識蒸留 mate の値はそのまま学習する

tanuki- 2025-05-25 知識蒸留 Ranger

tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade

tanuki- 2025-05-17 知識蒸留 Kanade

tanuki- 2025-05-08 知識蒸留 score_scaling=723

tanuki- 2025-05-01 知識蒸留 DL 水匠 + AobaZero

tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2)