tanuki- 2025-07-16 知識蒸留 棋譜追加 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20240329_153000_model_resnet30x384_relu_027 電竜戦TSEC指定…
tanuki- 2025-07-02 知識蒸留 DL 水匠 + AobaZero WCSC35 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 dlsuisho-15b-20220426 AobaZero 20250407_235846_model_resnet30x384_relu_06…
tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …
tanuki- 2025-06-22 知識蒸留 qsearch あり+なし アンサンブル 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に …
tanuki- 2025-06-14 知識蒸留 qsearch なし 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 シャッフル時に qsearch を行わない…
tanuki- 2025-06-02 知識蒸留 重複した局面を取り除く 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 重複した局面を取り除く…
tanuki- 2025-05-29 知識蒸留 mate の値はそのままにする 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 学習データの mate の…
tanuki- 2025-05-25 知識蒸留 Ranger 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Optimizer に Ranger を使用する。 棋譜生…
tanuki- 2025-05-22 知識蒸留 DL 水匠 + AobaZero + Kanade 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 Kanade_p8 棋譜生成…
tanuki- 2025-05-17 知識蒸留 Kanade 実験内容 知識蒸留を行う。 教師モデルには Kanade_p8 を使用した。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-.nnue-pytorch-2024-07-30.1 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 …
tanuki- 2025-05-08 知識蒸留 score_scaling=723 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 score_scaling に 723 を設定…
tanuki- 2025-05-01 知識蒸留 アンサンブル DL 水匠 + AobaZero 実験内容 知識蒸留を行う。 複数の教師モデルをアンサンブルする。 アンサンブルには以下のモデルを使用する。 DL 水匠 AobaZero 20240329_153000_model_resnet30x384_relu_027 棋譜生成 生成…
tanuki- 2025-04-26 学習データの評価値を AobaZero で付けなおす (2) 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を AobaZero で付けなおし、学習させ、レーティングを測定する。 前回の実験で score_scaling が意図せず 361 になって…
tanuki- 2025-04-20 学習データの評価値を DL 水匠で付けなおす lambda 減衰 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を DL 水匠で付けなおし、学習させ、レーティングを測定する。 100 手目から 120 手目にかけて、 lambda を 1.0 …
tanuki- 2025-04-14 学習データの評価値を model-0020-80b512v27b で付けなおす 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を model-0020-80b512v27b で付けなおし、学習させ、レーティングを測定する。 棋譜生成 生成ルーチン tanuki…
tanuki- 2025-03-18 学習データの評価値をふかうら王で付けなおす lambda=1.0 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値をふかうら王で付けなおし、学習させ、レーティングを測定する。 labda=1.0 として学習する。 棋譜生成 生成ル…
tanuki- 2025-03-04 学習データの評価値を AobaZero で付けなおす 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を AobaZero で付けなおし、学習させ、レーティングを測定する。 labda=1.0 として学習する。 棋譜生成 生成ルーチン tanuk…
tanuki- 2025-02-25 学習データの評価値を DL 水匠 で付けなおす 入玉ボーナスなし 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を DL 水匠 で付けなおし、学習させ、レーティングを測定する。 入玉ボーナスを無効化する。 棋譜生成 生…
tanuki- 2025-02-21 知識蒸留 in_scaling・out_scaling 調整 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を DL 水匠 で付けなおし、学習させ、レーティングを測定する。 in_scaling・out_scaling を調整する。 in_scaling は学習中の f…
tanuki- 2025-01-31 学習データの評価値を DL 水匠 で付けなおす FV_SCALE の調整 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を DL 水匠 で付けなおし、学習させ、レーティングを測定する。 lambda=1.0 とする。 FV_SCALE の最適値を…
tanuki- 2025-01-26 学習データの評価値を AobaZero で付けなおす 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を AobaZero で付けなおし、学習させ、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数…
tanuki- 2025-01-21 学習データの評価値を DL 水匠で付け直す lambda=1.0 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を DL 将棋で付けなおし、学習させ、レーティングを測定する。 lambda=1.0 とする。 棋譜生成 生成ルーチン tanuki-…
tanuki- 2025-01-14 大森さんのブランチ クロスエントロピーロス関数 実験内容 氷彗開発者大森さんのブランチを試す。 学習器には https://github.com/saihyou/nnue-pytorch/tree/feature/layer_stack_1536 に、自分のブランチの内容をマージしたものを使用…
tanuki- 2025-01-01 学習データの評価値をふかうら王で付けなおす 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値をふかうら王 (fuka20x-0173-20241223) で付けなおし、学習させ、レーティングを測定する。 棋譜生成 生成ルーチン tanuki-…
tanuki- 2024-12-25 学習データの評価値を DL 水匠で付けなおす 実験内容 学習データ tanuki-.nnue-pytorch-2024-07-30.1 の評価値を DL 将棋で付けなおし、学習させ、レーティングを測定する。 棋譜生成 ランダムパラメーターから学習させる際の学習データ …
tanuki- 2024-12-17 大森さんのブランチ 実験内容 氷彗開発者大森さんのブランチを試す。 学習器には https://github.com/saihyou/nnue-pytorch/tree/feature/layer_stack_1536 に、自分のブランチの内容をマージしたものを使用する。 思考エンジンには http…
tanuki- 2024-12-09 駒の可動性 実験内容 入力特徴量に HalfKP の他に駒の可動性を加え、学習させ、レーティングを測定する。 可動性は、あるマスにおいて、ある種類の駒が、何マス動けるか、を one-hot encoding して表現する。 対象の駒は、龍・馬・飛・角…
tanuki- 2024-11-28 tanuki-.nnue-pytorch-2024-07-30.1 で生成した学習データによる学習 1 回目の収束後の lambda を手数に応じて変える Fine-tuning 実験内容 tanuki-.nnue-pytorch-2024-07-30.1 を用いて生成した学習データで学習させた評価関数に対し、 …
tanuki- 2024-11-27 tanuki-.nnue-pytorch-2024-07-30.1 で生成した学習データによる学習 1 回目の収束後の lambda を手数に応じて変える 実験内容 tanuki-.nnue-pytorch-2024-07-30.1 を用いて生成した学習データで学習させる。 ランダムパラメーターからの…
tanuki- 2024-11-22 tanuki-.nnue-pytorch-2024-07-30.1 で生成した学習データによる学習 1 回目の収束後の lambda=0.1 実験内容 tanuki-.nnue-pytorch-2024-07-30.1 を用いて生成した学習データで学習させる。 ランダムパラメーターからの学習には、 tanuki…