nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

tanuki- 2019-11-17 halfkp_256x2-32-32-sc

tanuki- 2019-11-17 halfkp_256x2-32-32-sc

  • 棋譜生成
    • 機械学習1週目および1周目追加学習
      • 生成ルーチン
        • tanuki-棋譜生成ルーチン
      • 評価関数
        • KPPT
        • Apery SDT5
      • 1手当たりの思考
        • 探索深さ 8
      • 開始局面
        • foodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面
      • 生成局面数
        • 50億
      • 生成条件
        • 対局は打ち切らず詰みの局面まで学習データに出力する
      • 機械学習2週目以降(強化学習1週目以降)
        • 生成ルーチン
          • tanuki-棋譜生成ルーチン
        • 評価関数
          • halfkp_256x2-32-32-sc
        • 1手あたりの思考
          • 思考ノード数 50万
            • 探索途中に思考ノード数上限に達したら即座に思考を停止する
          • 開始局面
            • foodgate上の棋譜から1局面ランダムに選択し、ランダムに1手指した局面
          • 生成局面数
            • 3千万局面生成×10セット
          • 生成条件
            • 対局は打ち切らず詰みの局面まで学習データに出力する
          • シャフル
            • あり
          • 機械学習
            • やねうら王機械学習ルーチン
            • 学習モデル
              • halfkp_256x2-32-32-sc
                • halfkp_256x2-32-32の出力層に、隠れ層1層目の出力にアフィン変換を掛けたものを追加したもの
              • 学習手法
                • SGD
                • ミニバッチ法
              • 学習パラメーター
                • Hash
                  • 4096
                • loop
                  • 100
                • batchsize
                  • 1000000
                • lambda
                  • 機械学習1周目
                    • 1.0
                  • 機械学習1周目追加学習委以降
                    • 0.5
                  • eta
                    • 機械学習1周目
                      • 0.5
                    • 機械学習1周目追加学習
                      • 0.1
                    • 機械学習2周目以降(強化学習1周目以降)
                      • 0.01
                    • newbob_decay
                      • 0.5
                    • nn_batch_size
                      • 1000
                    • eval_save_interval
                      • 100000000
                    • loss_output_interval
                      • 1000000
                    • mirror_percentage
                      • 50
                    • eval_limit
                      • 機械学習1周目
                        • 3000
                      • 機械学習1周目追加学習以降
                        • 32000
                      • レーティング測定
                        • 対局相手
                          • tanuki-wcsc29-2019-05-06
                        • 思考ノード数: 200万ノード
                        • 全対局数: 1000
                        • 同時対局数: 20
                        • ハッシュサイズ: 512
                        • 開始局面: やねうら王互換局面集24手目からランダムに選択

                        実験結果

                        機械学習1周目

                        22:59:08 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=\\tk1-algo-02\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=1.eta=0.5\final

                        22:59:08 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval

                        22:59:08 対局数1000 先手勝ち496(50%) 後手勝ち489(49%) 引き分け15

                        22:59:08 engine1

                        22:59:08 勝ち291(29% R-150.99) 先手勝ち154(15%) 後手勝ち137(13%)

                        22:59:08 宣言勝ち7 先手宣言勝ち3 後手宣言勝ち4

                        22:59:08 先手引き分け8 後手引き分け7

                        22:59:08 engine2

                        22:59:08 勝ち694(70%) 先手勝ち342(34%) 後手勝ち352(35%)

                        22:59:08 宣言勝ち1 先手宣言勝ち1 後手宣言勝ち0

                        22:59:08 先手引き分け7 後手引き分け8

                        機械学習1周目追加学習

                        17:37:42 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=1.lambda=0.5.eta=0.10.add\final

                        17:37:42 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval

                        17:37:42 対局数1000 先手勝ち497(51%) 後手勝ち472(48%) 引き分け31

                        17:37:42 engine1

                        17:37:42 勝ち376(38% R-79.15) 先手勝ち201(20%) 後手勝ち175(18%)

                        17:37:42 宣言勝ち4 先手宣言勝ち1 後手宣言勝ち3

                        17:37:42 先手引き分け16 後手引き分け15

                        17:37:42 engine2

                        17:37:42 勝ち593(61%) 先手勝ち296(30%) 後手勝ち297(30%)

                        17:37:42 宣言勝ち3 先手宣言勝ち1 後手宣言勝ち2

                        17:37:42 先手引き分け15 後手引き分け16

                        機械学習2周目(強化学習1周目)

                        20:11:07 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=2\final

                        20:11:07 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval

                        20:11:07 対局数1000 先手勝ち502(52%) 後手勝ち463(47%) 引き分け35

                        20:11:07 engine1

                        20:11:07 勝ち442(45% R-29.23) 先手勝ち233(24%) 後手勝ち209(21%)

                        20:11:07 宣言勝ち2 先手宣言勝ち1 後手宣言勝ち1

                        20:11:07 先手引き分け13 後手引き分け22

                        20:11:07 engine2

                        20:11:07 勝ち523(54%) 先手勝ち269(27%) 後手勝ち254(26%)

                        20:11:07 宣言勝ち8 先手宣言勝ち6 後手宣言勝ち2

                        20:11:07 先手引き分け22 後手引き分け13

                        機械学習3周目(強化学習2周目)

                        02:09:51 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=3\final

                        02:09:51 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval

                        02:09:51 対局数1000 先手勝ち515(53%) 後手勝ち450(46%) 引き分け35

                        02:09:51 engine1

                        02:09:51 勝ち459(47% R-16.94) 先手勝ち250(25%) 後手勝ち209(21%)

                        02:09:51 宣言勝ち12 先手宣言勝ち6 後手宣言勝ち6

                        02:09:51 先手引き分け14 後手引き分け21

                        02:09:51 engine2

                        02:09:51 勝ち506(52%) 先手勝ち265(27%) 後手勝ち241(24%)

                        02:09:51 宣言勝ち10 先手宣言勝ち3 後手宣言勝ち7

                        02:09:51 先手引き分け21 後手引き分け14

                        機械学習4周目(強化学習3周目)

                        08:01:46 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=4\final

                        08:01:46 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval

                        08:01:46 対局数1000 先手勝ち502(52%) 後手勝ち463(47%) 引き分け35

                        08:01:46 engine1

                        08:01:46 勝ち460(47% R-16.21) 先手勝ち245(25%) 後手勝ち215(22%)

                        08:01:46 宣言勝ち8 先手宣言勝ち5 後手宣言勝ち3

                        08:01:46 先手引き分け16 後手引き分け19

                        08:01:46 engine2

                        08:01:46 勝ち505(52%) 先手勝ち257(26%) 後手勝ち248(25%)

                        08:01:46 宣言勝ち8 先手宣言勝ち4 後手宣言勝ち4

                        08:01:46 先手引き分け19 後手引き分け16

                        機械学習5周目(強化学習4周目)

                        13:59:09 engine1=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine1\source\YaneuraOu-by-gcc.exe eval1=F:\hnoda\nnue\eval\halfkp_256x2-32-32-sc.iteration=5\final

                        13:59:09 engine2=E:\Jenkins\workspace\TanukiColiseum.2018-12-08\engine2\source\YaneuraOu-by-gcc.exe eval2=F:\hnoda\tanuki-wcsc29-2019-05-06\eval

                        13:59:09 対局数1000 先手勝ち506(52%) 後手勝ち456(47%) 引き分け38

                        13:59:09 engine1

                        13:59:09 勝ち440(45% R-29.69) 先手勝ち240(24%) 後手勝ち200(20%)

                        13:59:09 宣言勝ち8 先手宣言勝ち3 後手宣言勝ち5

                        13:59:09 先手引き分け20 後手引き分け18

                        13:59:09 engine2

                        13:59:09 勝ち522(54%) 先手勝ち266(27%) 後手勝ち256(26%)

                        13:59:09 宣言勝ち6 先手宣言勝ち1 後手宣言勝ち5

                        13:59:09 先手引き分け18 後手引き分け20