nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2021-05-05 たややん式定跡生成手法 長時間での測定

tanuki- 2021-05-05 たややん式定跡生成手法 長時間での測定

実験方法

定跡生成

  • floodgate の 2020 年以降かつ、レーティング 3300 以上のソフト同士の対局の棋譜の指し手を抽出する
  • 自己対戦の棋譜から指し手を抽出する
  • 上記をマージする
  • 各局面の各指し手について、その指し手を指した際の勝った回数と負けた回数をカウントし、(勝った回数 / (勝った回数 + 負けた回数)) が 0.3 未満の指し手を削除する
  • 指し手に評価値が付与されている場合、評価値が、先手は -140 、後手は -200 未満の指し手を削除する。

レーティング測定

対局相手 halfkp_256x2-32-32.iteration=2.weight_by_progress=1.nodes=100000.lambda=0.4
思考時間 持ち時間 300 秒 + 1 手 2 秒加算 持ち時間 900 秒 + 1 手 5 秒加算
対局数 2000
同時対局数 64
ハッシュサイズ 768
開始局面 平手

実験結果

持ち時間 300 秒 + 1 手 2 秒加算

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=0 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-02-25\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.02 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-02-25\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=2.weight_by_progress=1.nodes=100000.lambda=0.4\final 定跡手数=256 定跡ファイル名=user_book1.db 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=300000 秒読み時間(ms)=0 加算時間(ms)=2000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=true 定跡の手数を無視する=false

思考エンジン2 name=YaneuraOu NNUE 6.02 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-02-25\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=2.weight_by_progress=1.nodes=100000.lambda=0.4\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=300000 秒読み時間(ms)=0 加算時間(ms)=2000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=true 定跡の手数を無視する=false

対局数2000 先手勝ち1048(59.2%) 後手勝ち723(40.8%) 引き分け229

engine1

勝ち1150(64.9% R94.1 +-15.8) 先手勝ち665(37.5%) 後手勝ち485(27.4%)

宣言勝ち55 先手宣言勝ち32 後手宣言勝ち23 先手引き分け132 後手引き分け97

engine2

勝ち621(35.1%) 先手勝ち383(21.6%) 後手勝ち238(13.4%)

宣言勝ち39 先手宣言勝ち28 後手宣言勝ち11 先手引き分け97 後手引き分け132

1150,229,621

持ち時間 900 秒 + 1 手 5 秒加算

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=0 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-02-25\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.02 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-02-25\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=2.weight_by_progress=1.nodes=100000.lambda=0.4\final 定跡手数=256 定跡ファイル名=user_book1.db 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=true 定跡の手数を無視する=false

思考エンジン2 name=YaneuraOu NNUE 6.02 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-02-25\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=2.weight_by_progress=1.nodes=100000.lambda=0.4\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=true 定跡の手数を無視する=false

対局数2000 先手勝ち968(56.9%) 後手勝ち732(43.1%) 引き分け300

engine1

勝ち888(52.2% R13.2 +-15.2) 先手勝ち501(29.5%) 後手勝ち387(22.8%)

宣言勝ち84 先手宣言勝ち46 後手宣言勝ち38 先手引き分け146 後手引き分け154

engine2

勝ち812(47.8%) 先手勝ち467(27.5%) 後手勝ち345(20.3%)

宣言勝ち74 先手宣言勝ち36 後手宣言勝ち38 先手引き分け154 後手引き分け146

888,300,812

まとめ

floodgate の 2020 年以降かつ、レーティング 3300 以上のソフト通しの棋譜と、自己対戦の棋譜から定跡を生成した。各指し手を指した場合の勝った回数と負けた回数から勝率を計算し、勝率が 30% 未満の指し手を取り除いた。また、評価値が付いている指し手については、評価値が、先手は -140 未満、後手は -200 未満の指し手は削除した。

上記を持ち時間を変えてレーティングを計測した。結果、持ち時間 300 秒 + 1 手 2 秒加算の場合に比べ、持ち時間 900 秒 + 1 手 5 秒加算はレーティングが大幅に下がった。

レーティングが低いソフトの指し手、または持ち時間が短い自己対戦の指し手のいずれか、またはそれら両方の指し手が、長時間の対局で適切に咎められたため、レーティングが下がったのだと考えられる。 レーティングの下限、勝率の下限、評価値の下限、それぞれについて、再度検証する必要がある。