2021-01-01から1年間の記事一覧
tanuki- 2021-09-03 AMD Optimizing CPU Libraries 実験結果 実験内容 AMD Optimizing CPU Libraries を用い、機械学習ルーチンがどの程度高速化するか調べる 1000万局面程学習させ、学習時間を比較する 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価…
tanuki- 2021-07-16 L2正規化パラメーター調整 実験内容 L2 正規化パラメーターを調整しながら機械学習を行い、自己対局によりレーティングを測定する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-denryu-tsec-1 eval 1手あたりの思考…
tanuki- 2021-07-10 思考ノード数調整 実験内容 棋譜生成時の思考ノード数を、自動調整した場合としない場合を比較する 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-denryu-tsec-1 eval 1手あたりの思考 思考ノード数 50,000 ノードをベ…
tanuki- 2021-07-02 nn_batch_size調整 (自己対局の初期局面変更) 実験内容 機械学習時に nn_batch_size を調整し、自己対局によりレーティングを計測する。 「tanuki- 2021-06-30 nn_batch_size調整」では、初期局面として、やねうら王互換局面集を使用する…
tanuki- 2021-06-30 nn_batch_size調整 実験内容 機械学習時に nn_batch_size を調整し、自己対局によりレーティングを計測する。 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-denryu-tsec-1 eval 1手あたりの思考 思考ノード数 50,000 …
tanuki- 2021-06-24 思考ノード数調整 実験内容 棋譜生成時の思考ノード数を、やねうら王の反復深化ルーチンに実装されている時間調整手法を応用して、自動調整する 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 tanuki-denryu-tsec-1 eval 1手…
tanuki- 2021-06-22 評価値のスケール 実験方法 ランダムパラメーターからの学習時、学習データの評価値に係数を掛けて学習させる。 係数とレーティングの関連を調べる。 レーティング測定 対局相手 halfkp_256x2-32-32.iteration=1 思考時間 持ち時間 900 …
tanuki- 2021-06-22 思考ノード数 vs 平均手数 実験内容 tanuki- 棋譜生成ルーチンを用い、思考ノード数と平均手数の関連性を調べる 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 100 ~ 51,200 開始局面 fo…
tanuki- 2021-06-22 思考ノード数 vs 平均手数 実験内容 tanuki- 棋譜生成ルーチンを用い、思考ノード数と平均手数の関連性を調べる 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 100 ~ 51,200 開始局面 fo…
tanuki- 2021-06-17 nnue-pytorch qsearch()あり 実験方法 nnue-pytorch のチェス部分をやねうら王に差し替える glinscott/nnue-pytorch: NNUE (Chess evaluation) trainer in Pytorch 本家では学習局面から qsearch() をしていないが、今回は行っている tra…
tanuki- 2021-05-14 nnue-pytorch 実験方法 nnue-pytorch のチェス部分をやねうら王に差し替える glinscott/nnue-pytorch: NNUE (Chess evaluation) trainer in Pytorch train.py を用いてランダムパラメーターから学習させる serialize.py を用いてやねうら…
tanuki- 2021-05-13 評価値のスケール 実験方法 Eval::evaluate() の出力に定数係数を掛け、レーティングを測定する。 レーティング測定 対局相手 halfkp_256x2-32-32.iteration=2.weight_by_progress=1.nodes=100000.lambda=0.4 思考時間 持ち時間 900 秒 +…
tanuki- 2021-05-12 人造棋士18号式定跡生成手法の追試 (長時間対局) 実験方法 定跡生成 floodgate の 2020 年以降の棋譜から、勝ったほうのソフトの指し手のみを抽出して、定跡とする 抽出する棋譜の両方のソフトのレーティングの下限を変えながら、定跡な…
tanuki- 2021-05-05 たややん式定跡生成手法 長時間での測定 実験方法 定跡生成 floodgate の 2020 年以降かつ、レーティング 3300 以上のソフト同士の対局の棋譜の指し手を抽出する 自己対戦の棋譜から指し手を抽出する 上記をマージする 各局面の各指し手…
本ブログエントリは、2021年5月3日~5日に開催された、第 31 回世界コンピュータ将棋選手権参加記録 (以下 wcsc31) の参加記録です。 たぬきち tanuki- チームは、大会前に参加名を変えています。今回の参加名は、どうぶつの森シリーズの登場キャラクター「…
tanuki- 2021-04-24 たややん式定跡生成手法+評価値 実験方法 定跡生成 floodgate の 2020 年以降かつ、レーティング 3300 以上のソフト同士の対局の棋譜の指し手を抽出する 自己対戦の棋譜から指し手を抽出する 上記をマージする 各局面の各指し手について…
tanuki- 2021-04-19 たややん式定跡生成手法の追試 実験方法 定跡生成 floodgate の 2020 年以降かつ、レーティング 3300 以上のソフト同士の対局の棋譜の指し手を抽出する 自己対戦の棋譜から指し手を抽出する 上記をマージする 各局面の各指し手について、…
tanuki- 2021-04-09 人造棋士18号式定跡生成手法の追試 実験方法 定跡生成 floodgate の 2020 年以降の棋譜から、勝ったほうのソフトの指し手のみを抽出して、定跡とする 抽出する棋譜の両方のソフトのレーティングの下限を変えながら、定跡なしのソフトとの…
tanuki- 2021-03-22 halfkp_256x2-32-32 Weighted Loss 2周目 棋譜生成時ノード数調査 実験方法 棋譜生成 生成ルーチン tanuki- 棋譜生成ルーチン 評価関数 halfkp_256x2-32-32.iteration=1.weight_by_progress=1.add.lambda=0.5 1手あたりの思考 思考ノード…
tanuki- 2021-03-22 halfkp_256x2-32-32 Weighted Loss 2周目 棋譜生成時ノード数調査 実験方法 棋譜生成 生成ルーチン tanuki- 棋譜生成ルーチン 評価関数 halfkp_256x2-32-32.iteration=1.weight_by_progress=1.add.lambda=0.5 1手あたりの思考 思考ノード…
tanuki- 2021-03-22 halfkp_256x2-32-32 vs halfkpe9_256x2-32-32 Weighted Loss 1周目 + 追加学習 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に…
tanuki- 2021-03-22 halfkp_256x2-32-32 Weighted Loss 1周目 + 追加学習 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止した 開始局面 f…
tanuki- 2021-02-28 halfkp_256x2-32-32 Weighted Loss 1周目 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止した 開始局面 foodgate上の…
tanuki- 2021-02-28 halfkpe9_256x2-32-32 Weighted Loss 1周目 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止した 開始局面 foodgate上…
tanuki- 2021-02-28 halfkp_256x2-32-32 vs halfkpe9_256x2-32-32 Weighted Loss 1周目 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止し…
tanuki- 2021-02-28 halfka_256x2-32-32 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止した 開始局面 foodgate上の棋譜の32手目までから…
tanuki- 2021-02-28 halfkp-halfkv_256x2-32-32 実験方法 棋譜生成 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 水匠2 1手あたりの思考 思考ノード数 5万 探索途中に思考ノード数上限に達したら即座に思考を停止した 開始局面 foodgate上の棋譜の32手目…