2025-01-01から1年間の記事一覧
tanuki- 2025-12-27 SFNNwoP1536 SGD+Momentum 実験内容 ネットワークアーキテクチャーに SFNNwoP1536 を使用する。 学習手法に SGD+Momentum を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手…
tanuki- 2025-12-24 SFNNwoP1536 実験内容 ネットワークアーキテクチャーに SFNNwoP1536 を使用する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノ…
tanuki- 2025-12-20 Policy による学習データ生成 採択率の下限 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 指し手採択率の下限を 0.1 とした。 採択率の下限を上回る指し手が存在しない場合、採択率に 0.5 を掛けて…
tanuki- 2025-12-01 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (3) 実験内容 アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。 知識蒸留には以下のモデルを使用する。 DL 水匠 (dls…
tanuki- 2025-11-25 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する (2) 実験内容 アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。 知識蒸留には以下のモデルを使用する。 DL 水匠 (dls…
tanuki- 2025-11-17 アンサンブル前の教師データで学習したあとアンサンブル後の教師データで学習する 実験内容 アンサンブル前の教師データで学習したあと、アンサンブル後の教師データで学習する。 知識蒸留には以下のモデルを使用する。 DL 水匠 (dlsuish…
tanuki- 2025-11-08 棋譜生成 nodes=500 実験内容 学習データの生成に CPU エンジンを使用する。 探索ノード数を 500 とする。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 (dlsuisho…
tanuki- 2025-10-28 棋譜生成 nodes=1000 実験内容 学習データの生成に CPU エンジンを使用する。 探索ノード数を 1000 とする。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 (dlsuis…
tanuki- 2025-10-15 Policy による学習データ生成 Softmax_Temperature=50 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデル…
tanuki- 2025-10-03 Policy による学習データ生成 Softmax_Temperature=100 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデ…
tanuki- 2025-09-21 Policy による学習データ生成 実験内容 学習データ生成の際、 GPU エンジンの Policy を用いて指し手を選択する。 生成後、知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 (d…
tanuki- 2025-08-23 halfkp_1024x2-8-96 ステージ 2 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネ…
tanuki- 2025-08-13 halfkp_1536x2-8-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…
tanuki- 2025-08-07 halfkp_1024x2-8-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…
tanuki- 2025-08-02 halfkp_768x2-8-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…
tanuki- 2025-07-24 halfkp_512x2-8-128 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…
tanuki- 2025-07-20 halfkp_512x2-16-96 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 ネットワークア…
tanuki- 2025-07-16 知識蒸留 棋譜追加 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 電竜戦TSEC指定…
tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20250407_235846_model_resnet30x384_relu_06…
tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …
tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …
tanuki- 2025-06-14 知識蒸留 qsearch なし 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に qsearch を行わない…
tanuki- 2025-06-02 知識蒸留 重複した局面を取り除く 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 重複した局面を取り除く…
tanuki- 2025-05-29 知識蒸留 mate の値はそのままにする 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 学習データの mate の…
tanuki- 2025-05-25 知識蒸留 Ranger 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Optimizer に Ranger を使用する。 棋譜生…
tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Kanade_p8 棋譜生成…
tanuki- 2025-05-17 知識蒸留 Kanade 実験内容 知識蒸留を行う。 教師モデルには Kanade_p8 を使用した。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …
tanuki- 2025-05-08 知識蒸留 score_scaling=723 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 score_scaling に 723 を設定…
tanuki- 2025-05-01 知識蒸留 アンサンブル DL 水匠 + AobaZero 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 棋譜生成 生成…
tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2) 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を AobaZero で付けなおし、学習させ、レーティングを測定する。 前回の実験で score_scaling が意図せず 361 になって…