tanuki- 2021-09-30 勝敗項の教師信号

tanuki- 2021-09-30 勝敗項の教師信号

実験内容

  • 学習時の勝敗項の教師信号を変えながら学習させ、勝率を測定する

棋譜生成

生成ルーチン tanuki-棋譜生成ルーチン
評価関数 tanuki-wcsc28
1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード
開始局面 foodgate上の棋譜の24手目までから1局面ランダムに選択し、その局面を開始局面とした
生成局面数 1 億局面× 3 セット
生成条件 対局は打ち切らず詰みの局面まで学習データに出力した

機械学習

機械学習ルーチン やねうら王機械学習ルーチン
学習モデル halfkp_256x2-32-32
学習手法 SGD ミニバッチ法
USI_Hash 1024
Threads 16
loop 100
batchsize 1000000
lambda 0.4
eta 0.01
newbob_decay 0.5
nn_batch_size 1000
eval_save_interval 100000000
loss_output_interval 1000000
mirror_percentage 50
eval_limit 32000
weight_by_progress 無効
次元下げ K・P・HalfRelativeKP・左右対称
学習データ内で重複した局面の除外 しない
初期ネットワークパラメーター tanuki-wcsc28
勝敗項の教師信号 0.75~1.0-eps

レーティング測定

対局相手 tanuki-wcsc28
思考時間 持ち時間 900 秒 + 1 手 5 秒加算
対局数 2000
同時対局数 64
ハッシュサイズ 768
開始局面 たややん互換局面集

実験結果

機械学習

レーティング測定

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.750000\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち920(52.9%) 後手勝ち819(47.1%) 引き分け261

engine1

勝ち863(49.6% R-2.3 +-15.2) 先手勝ち451(25.9%) 後手勝ち412(23.7%)

宣言勝ち48 先手宣言勝ち21 後手宣言勝ち27 先手引き分け120 後手引き分け141

engine2

勝ち876(50.4%) 先手勝ち469(27.0%) 後手勝ち407(23.4%)

宣言勝ち15 先手宣言勝ち12 後手宣言勝ち3 先手引き分け141 後手引き分け120

863,261,876

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.875000\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち936(53.5%) 後手勝ち812(46.5%) 引き分け252

engine1

勝ち1004(57.4% R45.4 +-15.4) 先手勝ち543(31.1%) 後手勝ち461(26.4%)

宣言勝ち33 先手宣言勝ち15 後手宣言勝ち18 先手引き分け148 後手引き分け104

engine2

勝ち744(42.6%) 先手勝ち393(22.5%) 後手勝ち351(20.1%)

宣言勝ち10 先手宣言勝ち1 後手宣言勝ち9 先手引き分け104 後手引き分け148

1004,252,744

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.937500\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち964(53.8%) 後手勝ち827(46.2%) 引き分け209

engine1

勝ち1118(62.4% R78.6 +-15.6) 先手勝ち600(33.5%) 後手勝ち518(28.9%)

宣言勝ち81 先手宣言勝ち42 後手宣言勝ち39 先手引き分け118 後手引き分け91

engine2

勝ち673(37.6%) 先手勝ち364(20.3%) 後手勝ち309(17.3%)

宣言勝ち4 先手宣言勝ち2 後手宣言勝ち2 先手引き分け91 後手引き分け118

1118,209,673

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.968750\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち971(53.4%) 後手勝ち846(46.6%) 引き分け183

engine1

勝ち1121(61.7% R75.0 +-15.6) 先手勝ち595(32.7%) 後手勝ち526(28.9%)

宣言勝ち88 先手宣言勝ち46 後手宣言勝ち42 先手引き分け95 後手引き分け88

engine2

勝ち696(38.3%) 先手勝ち376(20.7%) 後手勝ち320(17.6%)

宣言勝ち10 先手宣言勝ち2 後手宣言勝ち8 先手引き分け88 後手引き分け95

1121,183,696

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.984375\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち926(51.9%) 後手勝ち858(48.1%) 引き分け216

engine1

勝ち1123(62.9% R81.7 +-15.7) 先手勝ち578(32.4%) 後手勝ち545(30.5%)

宣言勝ち56 先手宣言勝ち27 後手宣言勝ち29 先手引き分け110 後手引き分け106

engine2

勝ち661(37.1%) 先手勝ち348(19.5%) 後手勝ち313(17.5%)

宣言勝ち8 先手宣言勝ち2 後手宣言勝ち6 先手引き分け106 後手引き分け110

1123,216,661

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.992188\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち933(52.6%) 後手勝ち840(47.4%) 引き分け227

engine1

勝ち1104(62.3% R76.8 +-15.6) 先手勝ち587(33.1%) 後手勝ち517(29.2%)

宣言勝ち75 先手宣言勝ち43 後手宣言勝ち32 先手引き分け136 後手引き分け91

engine2

勝ち669(37.7%) 先手勝ち346(19.5%) 後手勝ち323(18.2%)

宣言勝ち13 先手宣言勝ち3 後手宣言勝ち10 先手引き分け91 後手引き分け136

1104,227,669

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.996094\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち964(53.0%) 後手勝ち856(47.0%) 引き分け180

engine1

勝ち1165(64.0% R90.6 +-15.8) 先手勝ち617(33.9%) 後手勝ち548(30.1%)

宣言勝ち54 先手宣言勝ち27 後手宣言勝ち27 先手引き分け106 後手引き分け74

engine2

勝ち655(36.0%) 先手勝ち347(19.1%) 後手勝ち308(16.9%)

宣言勝ち16 先手宣言勝ち7 後手宣言勝ち9 先手引き分け74 後手引き分け106

1165,180,655

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.998047\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち931(51.5%) 後手勝ち876(48.5%) 引き分け193

engine1

勝ち1162(64.3% R91.9 +-15.8) 先手勝ち603(33.4%) 後手勝ち559(30.9%)

宣言勝ち67 先手宣言勝ち36 後手宣言勝ち31 先手引き分け115 後手引き分け78

engine2

勝ち645(35.7%) 先手勝ち328(18.2%) 後手勝ち317(17.5%)

宣言勝ち11 先手宣言勝ち9 後手宣言勝ち2 先手引き分け78 後手引き分け115

1162,193,645

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.999023\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち994(54.2%) 後手勝ち841(45.8%) 引き分け165

engine1

勝ち1093(59.6% R61.6 +-15.5) 先手勝ち594(32.4%) 後手勝ち499(27.2%)

宣言勝ち67 先手宣言勝ち40 後手宣言勝ち27 先手引き分け103 後手引き分け62

engine2

勝ち742(40.4%) 先手勝ち400(21.8%) 後手勝ち342(18.6%)

宣言勝ち18 先手宣言勝ち9 後手宣言勝ち9 先手引き分け62 後手引き分け103

1093,165,742

keyコマンドの送信に失敗しました。エンジン(ProcessIndex=97 GameIndex=48 EngineIndex=1)が異常終了またはタイムアウトしました。

keyコマンドの送信に失敗しました。エンジン(ProcessIndex=106 GameIndex=53 EngineIndex=0)が異常終了またはタイムアウトしました。

keyコマンドの送信に失敗しました。エンジン(ProcessIndex=100 GameIndex=50 EngineIndex=0)が異常終了またはタイムアウトしました。

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.999512\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち951(53.0%) 後手勝ち842(47.0%) 引き分け207

engine1

勝ち1083(60.4% R65.6 +-15.5) 先手勝ち572(31.9%) 後手勝ち511(28.5%)

宣言勝ち51 先手宣言勝ち22 後手宣言勝ち29 先手引き分け110 後手引き分け97

engine2

勝ち710(39.6%) 先手勝ち379(21.1%) 後手勝ち331(18.5%)

宣言勝ち17 先手宣言勝ち5 後手宣言勝ち12 先手引き分け97 後手引き分け110

1083,207,710

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.999900\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち950(52.1%) 後手勝ち873(47.9%) 引き分け177

engine1

勝ち1106(60.7% R68.4 +-15.5) 先手勝ち574(31.5%) 後手勝ち532(29.2%)

宣言勝ち55 先手宣言勝ち31 後手宣言勝ち24 先手引き分け91 後手引き分け86

engine2

勝ち717(39.3%) 先手勝ち376(20.6%) 後手勝ち341(18.7%)

宣言勝ち26 先手宣言勝ち10 後手宣言勝ち16 先手引き分け86 後手引き分け91

1106,177,717

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.999990\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち954(52.6%) 後手勝ち860(47.4%) 引き分け186

engine1

勝ち1164(64.2% R91.3 +-15.8) 先手勝ち609(33.6%) 後手勝ち555(30.6%)

宣言勝ち35 先手宣言勝ち18 後手宣言勝ち17 先手引き分け98 後手引き分け88

engine2

勝ち650(35.8%) 先手勝ち345(19.0%) 後手勝ち305(16.8%)

宣言勝ち17 先手宣言勝ち10 後手宣言勝ち7 先手引き分け88 後手引き分け98

1164,186,650

対局数=2000 同時対局数=64 ハッシュサイズ=768 開始手数=24 最大手数=320 開始局面ファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\TanukiColiseum\taya36_2020-11-06.sfen NUMAノード数=2 表示更新間隔(ms)=3600000

思考エンジン1 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine1\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\shogi\eval\tanuki-wcsc28.winning_percentage_for_win=0.999999\final 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮す

る=false 定跡の手数を無視する=false SlowMover=100

思考エンジン2 name=YaneuraOu NNUE 6.50 64ZEN2 EVAL_LEARN author=by yaneurao exeファイル=C:\Jenkins\workspace\TanukiColiseum.2021-09-05\engine2\source\YaneuraOu-by-gcc.exe 評

価関数フォルダパス=D:\hnoda\tnk-wcsc28-2018-05-05\eval 定跡手数=256 定跡ファイル名=no_book 思考ノード数=0 思考ノード数に加える乱数(%)=0 思考ノード数の乱数を1手毎に変化させる=False 持ち時間(ms)=900000 秒読み時間(ms)=0 加算時間(ms)=5000 乱数付き思考時間(ms)=0 スレッド数=1 BookEvalDiff=30 定跡の採択率を考慮する=false 定跡の手数を無視する=false SlowMover=100

対局数2000 先手勝ち964(53.2%) 後手勝ち847(46.8%) 引き分け189

engine1

勝ち1145(63.2% R84.9 +-15.7) 先手勝ち608(33.6%) 後手勝ち537(29.7%)

宣言勝ち47 先手宣言勝ち27 後手宣言勝ち20 先手引き分け106 後手引き分け83

engine2

勝ち666(36.8%) 先手勝ち356(19.7%) 後手勝ち310(17.1%)

宣言勝ち24 先手宣言勝ち13 後手宣言勝ち11 先手引き分け83 後手引き分け106

1145,189,666

合計勝率 先手勝率 後手勝率
0.75 49.6 25.9 23.7
0.875 57.4 31.1 26.4
0.9375 62.4 33.5 28.9
0.96875 61.7 32.7 28.9
0.984375 62.9 32.4 30.5
0.992188 62.3 33.1 29.2
0.996094 64 33.9 30.1
0.998047 64.3 33.4 30.9
0.999023 59.6 32.4 27.2
0.999512 60.4 31.9 28.5
0.9999 60.7 31.5 29.2
0.99999 64.2 33.6 30.6
0.999999 63.2 33.6 29.7

まとめ

学習時の勝敗項の教師信号を変えながら学習させ、勝率を測定した。

テストロスは、勝敗項の教師信号を大きくするほど下がった。

指し手一致度は、勝敗項の教師信号を大きくするほど上がった。

平手局面の評価値と勝敗項の教師信号の相関は見られなかった。

評価値の絶対値は、勝敗項の教師信号を大きくするほど上がった。

勝率は、勝敗項の教師信号が 0.998 付近と 0.999999 付近で高くなった。

勝敗項の教師信号を大きくするほどテストロスが下がるのは、教師信号が 0.5 に近づくほど交差エントロピーが大きくなるためだと考えらえる。

勝敗項の教師信号を大きくするほど指し手一致度が上がるのは、本実験だけからは説明が難しいように思う。曲面の進行度と指し手一致率の遷移を調べれば、何らかの知見が得られるかもしれない。

勝敗項の教師信号の大きさと平手局面の評価値に相関がみられないのは、勝敗項が平手局面の評価値にほとんど影響を与えない事を表しているのだと考えられる。

勝敗項の教師信号を大きくするほど評価値の絶対値が上がるのは、勝敗項により評価値の絶対値が引き上げられているためだと思われる。

勝敗項の教師信号が 0.998047 付近と 0.999999 付近で高くなったのは、それぞれ別の理由がある可能性がある。 0.998047 付近については、評価値の絶対値が 0.999999 に比べて小さい。これにより枝刈りパラメーターとうまくかみ合った可能性がある。 0.999999 付近については、最終版の指し手がより正確になったためという可能性がある。ただし、本実験からだけでは、これらの推測を確かめることはできない。曲面の進行度ごとの指し手一致率を調べれば、何らかの知見が得らえる可能性がある。

今後は、勝敗項の教師信号を 0.998047 にして実験を進めたいと思う。