tanuki- 2021-06-22 評価値のスケール
実験方法
- ランダムパラメーターからの学習時、学習データの評価値に係数を掛けて学習させる。
- 係数とレーティングの関連を調べる。
レーティング測定
対局相手 | halfkp_256x2-32-32.iteration=1 |
思考時間 | 持ち時間 900 秒 + 1 手 5 秒加算 |
対局数 | 2000 |
同時対局数 | 64 |
ハッシュサイズ | 768 |
開始局面 | 平手 |
実験結果
係数=0.95
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.95\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち896(54.4%) 後手勝ち752(45.6%) 引き分け352
engine1
勝ち815(49.5% R-3.1 +-15.2) 先手勝ち440(26.7%) 後手勝ち375(22.8%)
宣言勝ち50 先手宣言勝ち21 後手宣言勝ち29 先手引き分け170 後手引き分け182
engine2
勝ち833(50.5%) 先手勝ち456(27.7%) 後手勝ち377(22.9%)
宣言勝ち20 先手宣言勝ち11 後手宣言勝ち9 先手引き分け182 後手引き分け170
815,352,833
係数=0.90
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.90\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち836(51.7%) 後手勝ち781(48.3%) 引き分け383
engine1
勝ち760(47.0% R-16.9 +-15.3) 先手勝ち394(24.4%) 後手勝ち366(22.6%)
宣言勝ち48 先手宣言勝ち23 後手宣言勝ち25 先手引き分け192 後手引き分け191
engine2
勝ち857(53.0%) 先手勝ち442(27.3%) 後手勝ち415(25.7%)
宣言勝ち38 先手宣言勝ち22 後手宣言勝ち16 先手引き分け191 後手引き分け192
760,383,857
係数=0.85
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.85\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち820(51.0%) 後手勝ち787(49.0%) 引き分け393
engine1
勝ち724(45.1% R-27.7 +-15.3) 先手勝ち364(22.7%) 後手勝ち360(22.4%)
宣言勝ち33 先手宣言勝ち18 後手宣言勝ち15 先手引き分け184 後手引き分け209
engine2
勝ち883(54.9%) 先手勝ち456(28.4%) 後手勝ち427(26.6%)
宣言勝ち26 先手宣言勝ち6 後手宣言勝ち20 先手引き分け209 後手引き分け184
724,393,883
係数=0.80
keyコマンドの送信に失敗しました。エンジン(ProcessIndex=125 GameIndex=62 EngineIndex=1)が異常終了またはタイムアウトしました。
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.80\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち896(53.4%) 後手勝ち781(46.6%) 引き分け323
engine1
勝ち764(45.6% R-25.9 +-15.3) 先手勝ち408(24.3%) 後手勝ち356(21.2%)
宣言勝ち39 先手宣言勝ち17 後手宣言勝ち22 先手引き分け157 後手引き分け166
engine2
勝ち913(54.4%) 先手勝ち488(29.1%) 後手勝ち425(25.3%)
宣言勝ち31 先手宣言勝ち18 後手宣言勝ち13 先手引き分け166 後手引き分け157
764,323,913
係数=0.75
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.75\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち865(52.5%) 後手勝ち784(47.5%) 引き分け351
engine1
勝ち681(41.3% R-50.2 +-15.4) 先手勝ち348(21.1%) 後手勝ち333(20.2%)
宣言勝ち30 先手宣言勝ち13 後手宣言勝ち17 先手引き分け152 後手引き分け199
engine2
勝ち968(58.7%) 先手勝ち517(31.4%) 後手勝ち451(27.3%)
宣言勝ち27 先手宣言勝ち10 後手宣言勝ち17 先手引き分け199 後手引き分け152
681,351,968
係数=0.70
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.70\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち864(52.1%) 後手勝ち794(47.9%) 引き分け342
engine1
勝ち749(45.2% R-27.9 +-15.3) 先手勝ち393(23.7%) 後手勝ち356(21.5%)
宣言勝ち28 先手宣言勝ち18 後手宣言勝ち10 先手引き分け174 後手引き分け168
engine2
勝ち909(54.8%) 先手勝ち471(28.4%) 後手勝ち438(26.4%)
宣言勝ち31 先手宣言勝ち15 後手宣言勝ち16 先手引き分け168 後手引き分け174
749,342,909
係数=0.65
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.65\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち876(53.5%) 後手勝ち760(46.5%) 引き分け364
engine1
勝ち706(43.2% R-39.1 +-15.3) 先手勝ち375(22.9%) 後手勝ち331(20.2%)
宣言勝ち38 先手宣言勝ち16 後手宣言勝ち22 先手引き分け169 後手引き分け195
engine2
勝ち930(56.8%) 先手勝ち501(30.6%) 後手勝ち429(26.2%)
宣言勝ち28 先手宣言勝ち16 後手宣言勝ち12 先手引き分け195 後手引き分け169
706,364,930
係数=0.60
対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000
思考エンジン1 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine1\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1.training_data_score_scale=0.60\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
思考エンジン2 name=YaneuraOu NNUE 6.03 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=D:\Jenkins\workspace\TanukiColiseum.2021-05-09\engine2\source\YaneuraOu-by-gcc.exe 評価関数フォルダパス=D:\hnoda\shogi\eval\halfkp_256x2-32-32.iteration=1\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッ
ド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false 評価値のスケール(%)=100
対局数2000 先手勝ち881(53.0%) 後手勝ち780(47.0%) 引き分け339
engine1
勝ち606(36.5% R-79.4 +-15.6) 先手勝ち320(19.3%) 後手勝ち286(17.2%)
宣言勝ち28 先手宣言勝ち11 後手宣言勝ち17 先手引き分け153 後手引き分け186
engine2
勝ち1055(63.5%) 先手勝ち561(33.8%) 後手勝ち494(29.7%)
宣言勝ち32 先手宣言勝ち18 後手宣言勝ち14 先手引き分け186 後手引き分け153
606,339,1055
まとめ
ランダムパラメーターからの学習時、学習データの評価値に係数を掛けて学習させた。また、係数を変化させながら学習させ、レーティングの関連を調べた。
レーティング測定の結果、係数を掛けずに学習させた場合と比較し、有意に強くなった係数は存在しなかった。
1.0 以下の係数を掛けても、強くはならないと結論付けられる。