勝率最大かプレイアウト数最大かとか
たいていの場合は両者は一致するわけですが、
・残り100poのタイミングで追加したルート候補手がやたら回って勝率1位のままゴールされるのがいや
・でもその条件だとその候補手は100poこなしてるはずなので全然だめなわけではない
・その件なら単に残りpoがいくつ以下だったら候補手追加をやめれば対策になる
・poを独り占めしていた候補手で終盤になって相手の好手が見つかったら、見なかったことにする(po数最大)のかほかの手に賭ける(勝率最大)のか
・深い所だったら相手が気づかない方に賭けるのもアリですが、浅いところだったら遠慮したいところ
で、自己対戦で確認した範囲では有意な差は出ませんでした。
・北川さん修論を読み…ややこしい
・Discounted UCBみたいなことをやってみたがよろしくなかった