ネットワーク大きくすると対局時のプレイアウト数も自己対局の生成速度も落ちるから短期的には悪影響大きいよね

githubから読み取れたのは
- agzのように自己対局用のネットワークをテスト対局の勝率にかかわらず更新する、閾値を勝率50%に下げる
- ポリシーへのノイズ増やす
- 自己対局で最善手を打たずに探索する手数を以前のように長くすら
- 自己対局のプレイアウト数を増やす
- バッチ正規化を止める