nodchipのコンピューター将棋ブログ

コンピューター将棋ソフト「tanuki-」シリーズの実験結果を掲載しています。

第 32 回世界コンピュータ将棋選手権参加記録

本ブログエントリは、 2022 年 5 月 3 日~ 5 日に開催された、第 32 回世界コンピュータ将棋選手権の参加記録です。

マメット・ブンブク

今回の参加名は「マメット・ブンブク」でした。元ネタは FF14 で、利用者の将棋ライフのお供として、いつも寄り添う存在をイメージして付けました。

工夫点

マメット・ブンブクの工夫点は、以下の通りです。

定跡データベースの作成手法の変更

定跡データベースの作成に、たややん 2020 手法を改良したものを使用しました。

たややん 2020 手法においては、 floodgate 上の棋譜の指し手のうち、一定のレーティングのソフト棋譜に含まれ、かつ各指し手を指したときの勝率が 33% 以上のもののみを、定跡データベースに登録します。

tanuki-wcsc32 においては、レーティング 3900 以上のソフト同士の棋譜を使用し、勝率 33% 以上の指し手のみを使用しました。また、独自の工夫として、指し手の出現回数が 2 回以上のもののみ、使用しました。

学習データの生成条件の変更

NNUE 評価関数の学習に使用する学習データの生成条件を数点変更しました。

1 点目は、自己対局の対局開始局面の変更です。 tanuki-wcsc32 においては、自己対局の対局開始局面を、 floodgate 上のレーティング 3900 以上のソフト同士の棋譜のうち、 32 手目までからランダムに局面を選択するようにしました。また、開始局面の直後にランダムムーブを入れないようにしました。

2 点目は、自己対局の思考条件の変更です。 tanuki-wcsc32 においては、深さ 9 で探索を行い、自己対局を行いました。

3 点目は、学習データ量の増量です。 tanuki-wcsc32 においては、棋譜を 80 億局面分生成し、学習データとしました。

4 点目は、自己対局に使用する評価関数の変更です。 tanuki-wcsc32 においては、学習データの生成に水匠 5 を使用させていただきました。貴重なソフトを公開してくださり、ありがとうございました。

ネットワークアーキテクチャ

ネットワークアーキテクチャに halfkp_1024x2-8-32 を採用しました。これは、 Stockfish の過去のバージョンにおいて採用されたネットワークアーキテクチャです。 Stockfish においては、探索速度が低下したにもかかわらず、レーティングが向上したという報告が挙がっていたと記憶しています。

機械学習

tanuk-wcsc32 においては、 elmo 式学習法のうち、勝敗項の教師信号 (t) を、 0.8 と設定しました。これにより、レーティングを落とすことなく、評価値のスケールを下げることに成功しました。

実験結果

上記に挙げたものについては、本ブログにて実験結果を公開しています。各ブログエントリをご参照ください。

予選 1 日目

昨年度の引っ越しに伴い、会場までの移動にかかる時間が長くなってしまいました。また、年齢のせいか、早起きがつらくなってしまいました。そのため、今回は前日入りしてビジネスホテルに泊まることにしました。

1 泊 5,000 円前後の格安ビジネスホテルを予約していたのですが、ホテル側の都合でキャンセルとなってしまいました。代わりのホテルを探したところ、東横 INN Jr. が部屋数限定で 1 泊 5,000 円のプランを提供しているのを見つけ、予約しました。

ただ、あとから思ったのですが、今回は「東横将棋」というソフトが参加しており、東横 INN Jr. に泊まると、東横将棋に負けてしまうのではないかという予感がしました。幸い東横将棋さんとは対局がなかったため、負けずに済みました。次回からは、念のため、東横 INN Jr. には泊まらないようにしたいと思います。

予選 2 日目

今回は、決勝リーグ進出を目標としていました。決勝リーグへ進出するための条件は、 5.5 勝程度以上だと考え、対局のマッチングが良いことをひたすら願いました。

3 局目まではランダムにマッチングされるらしいのですが、「水匠」「やねうら王」という強豪チームに当たることができ、ソルコフ面で優位に立つことができました。

最終的には 6 勝 3 敗 4 位という好成績で、予選 2 日目を終えることができました。また、今年から上位 4 チームは、決勝リーグで先手を 4 回持つことができるようになりました。これにより、とても良い条件で決勝リーグを戦えることになりました。

決勝

決勝リーグの目標は、様々な点を考慮した結果、 4 勝 3 敗 4 位と定めました。また、この成績を獲得するため、千日手の評価値等を調整しました。

決勝リーグの最中、谷合先生とコンピュータ将棋ソフトについてお話しさせていただく機会がありました。谷合先生がコンピュータ将棋ソフトについて話しているとき、とても楽しそうにされているのが印象的でした。

最終的には 2 勝 3 敗 2 分の 5 位で決勝リーグを終えました。

よくよく思い出してみると、 tanuki- は wcsc 5 位という順位を何度か獲得しています。縁のある順位のようです。

終わりに

第 32 回世界コンピュータ将棋選手権が恙なく開催されたこと、関係者の皆様に厚くお礼申し上げます。これからのコンピュータ将棋ソフト界の発展を、ご祈念申し上げます。