tanuki- 2022-01-21 評価値の絶対値と局面の割合
実験内容
- 評価値の絶対値と局面の割合を調べる。
棋譜生成
A
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠2 |
1手あたりの思考 | 深さ最大 24 思考ノード数最大 50,000 ノード |
開始局面 | foodgateの2019年~2020年前半の棋譜の32手目までから1局面ランダムに選択し、ランダムに 1 手指し、その局面を開始局面とした |
生成局面数 | 10 億局面× 2 セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力した |
B
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠2 |
1手あたりの思考 | 深さ最大 9 思考ノード数最大 50,000 ノード |
開始局面 | foodgateの2019年~2020年前半の棋譜の32手目までから1局面ランダムに選択し、ランダムに 1 手指し、その局面を開始局面とした |
生成局面数 | 20 億局面 × 1 セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力した |
C
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠2 |
1手あたりの思考 | 深さ最大 9 思考ノード数最大 50,000 ノード |
開始局面 | foodgateの2019年~2020年前半の棋譜の32手目までから1局面ランダムに選択し、その局面を開始局面とした ランダムムーブなし |
生成局面数 | 20 億局面 × 1 セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力した |
D
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠2 |
1手あたりの思考 | 深さ最大 9 思考ノード数最大 50,000 ノード |
開始局面 | foodgate の 2020 年~ 2021 年の棋譜のうち、レーティング 3900 以上同士の対局の 32 手目までから 1 局面ランダムに選択し、その局面を開始局面とした ランダムムーブなし |
生成局面数 | 10 億局面 × 2 セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力した |
E
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠5 |
1手あたりの思考 | 深さ最大 9 思考ノード数最大 50,000 ノード |
開始局面 | foodgate の 2020 年~ 2021 年の棋譜のうち、レーティング 3900 以上同士の対局の 32 手目までから 1 局面ランダムに選択し、その局面を開始局面とした ランダムムーブなし |
生成局面数 | 10 億局面 × 2 セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力した |
F
生成ルーチン | tanuki-棋譜生成ルーチン |
評価関数 | 水匠5 |
1手あたりの思考 | 深さ最大 9 思考ノード数最大 50,000 ノード |
開始局面 | foodgate の 2020 年~ 2021 年の棋譜のうち、レーティング 3900 以上同士の対局の 32 手目までから 1 局面ランダムに選択し、その局面を開始局面とした ランダムムーブなし FV_SCALE=24 |
生成局面数 | 10 億局面 × 2 セット |
生成条件 | 対局は打ち切らず詰みの局面まで学習データに出力した |
実験結果
A vs B
B vs C
C vs D
D vs E
E vs F
まとめ
進行度と、その進行度に属する局面の割合を調べた。
A と B を比較した結果、 B のほうが評価値の絶対値が低い局面が多く、評価値の絶対値 1000 程度で逆転した。
B と C を比較した結果、 C のほうが評価値の絶対値が低い局面が多く、評価値の絶対値 1300 程度で逆転した。
C と D を比較した結果、 D のほうが評価値の絶対値が低い局面が多いが、評価値の絶対値 500 程度で逆転した。
D と E を比較した結果、 E のほうが評価値の絶対値が低い局面が少ないが、評価値の絶対値 1400 程度で逆転した。また、 E には特定の評価値に山があった。
E と F を比較した結果、 F のほうが評価値の絶対値が低い局面が多かった。また F には E より左の地点に山があった。
A と B の違いは、探索の深さである。探索の深さが浅いほうが、評価値の絶対値が小さい局面が多くなるという事だと思われる。
B と C の違いは、ランダムムーブの有無である。ランダムムーブにより、開始局面の評価値の絶対値が大きくなるという現象が起こっているのだと思われる。
C と D の違いは、開始局面の選び方である。強いソフト同士の対局のほうが、序盤の評価値の絶対値が小さいのだと思われる。
D と E の違いは、評価関数の差である。水匠 5 のほうが、全般的に評価値の絶対値が大きく、終盤の手数が短いのだと思われる。
E と F の違いは、 FV_SCALE の差である。 FV_SCALE を 24 に設定したほうが、評価値の絶対値が小さくなることと矛盾はない。
棋譜の生成条件により、評価値とそれに属する局面の割合が異なることが確かめられた。